JVM(Java Virtual Machine)

린베르노·2024년 4월 16일

CS지식

목록 보기
1/5

JVM(Java Virtual Machine)

JVM(자바 가상 머신)은 자바 언어에서만 사용하는 것이 아니다. 코틀린, 스칼라 언어에서도 JVM 동작 방식을 그대로 따른다.
따라서 JVM을 정확히 이해하면 추후에 자바에서 파생된 모던 언어를 이해하는데 있어 수월해지며, 내부에서 정확히 어떻게 동작을 해서 코드가 실행이 되는지 개념을 알면 코드 최적화나 리팩토링을 하는데 매우 도움이 된다.

JVM(자바 가상 머신) 실행 부분은 빨간 박스로 표시한 부분이고, 컴파일된 .class파일을 어떠한 처리를 거쳐 프로그램을 실행하는 과정이다.

자바 가상 머신(JVM)의 동작 방식

  1. 자바를 실행하면 JVM은 OS로부터 메모리 할당 받는다.
  2. 자바 컴파일러(javac)가 자바 소스코드(.java)를 바이트 코드(.class)로 컴파일 한다.
  3. Class Loader는 동적 로딩을 통해 필요한 클래스들을 로딩 및 링크하여 Runtime Data Area(실질적인 메모리를 할당 받아 관리하는 영역)으로 보낸다.
  4. Runtime Data Area에 로딩 된 바이트 코드는 Execution Engine을 통해 해석한다.
  5. 해당 과정에서 Execution Engine에 의해 Garbage Collector의 작동과 Thread 동기화가 이루어 진다.

자바 가상머신(JVM)의 구조

JVM은 아래와 같이 구성되어 있다.

클래스 로더 (Class Loader)

실행 엔진 (Execution Engine)

  • 인터프리터 (Interpreter)
  • JIT 컴파일러 (Just-in-Time)
  • 가비지 콜렉터 (Garbage Collector)

런타임 데이터 영역 (Runtime Data Area)

  • 메소드 영역
  • 힙 영역
  • PC Register
  • 스택 영역
  • 네이비트 메소드

JNI - 네이티브 메소드 인터페이스 (Native Method Interface)
네이티브 메소드 라이브러리 (Native Method Library)

클래스 로더 (Class Loader)

클래스 로더는 JVM 내로 클래스 파일(.class)을 동ㅈ덕으로 로드하고 링크를 통해 배치하는 작업을 수행하는 모듈
로드된 바이트 코드(.class)들을 엮어서 JVM의 메모리 영역인 Runtime Data Area에 배치한다.
클래스 파일 로딩 순서는 = Loading -> Linking -> Initialization 순으로 로딩된다.

Loading (로드) : 클래스 파일을 가져와서 JVM의 메모리에 로드한다.

Linking (링크) : 클래스 파일을 사용하기 위한 검증하는 과정.

  • Verifying (검증) : 로드한 클래스가 JVM에 명시된 대로 구성이 되어있는지 검사한다.
  • Preparing (준비) : 클래스가 필요로 하는 메모리를 할당한다.
  • Resolving (분석) : 클래스의 상수 풀 내 모든 심볼릭 레퍼런스를 다이렉트 레퍼런스로 변경한다.

Initialization (초기화) : 클래스 변수들을 적절한 값으로 초기화 한다.
(static 필드들을 설정된 값으로 초기화 등)

실행 엔진 (Execution Engine)

실행 엔진은 클래스 로더를 통해 런타임 데이터 영역(Runtime Data Area)에 배치된 바이트 코드를 명령어 단위로 읽어서 실행한다.
실행 엔진은 인터프리터와 JIT 컴파일러 두 가지 방식으로 혼합하여 바이트 코드를 실행한다.

인터프리터 (Interpreter)

바이트 코드 명령어를 하나씩 읽어서 해석하고 실행한다.
JVM안에서 바이트 코드는 기본적으로 인터프리터 방식으로 동작
다만 같은 메소드 라도 여러번 호출이 된다면 매번 해석하고 수향해야 되기 때문에 속도가 느리다.

JIT 컴파일러 (Just-In-Time Compiler)

인터프리터 (Interpreter)의 단점을 보완하기 위해 도입된 방식이다
반복되는 코드를 발견하여 바이트 코드를 컴파일하여 Native Code로 변경하고 이후 해당 메소드를 더 이상 인터프리트 하지 않고 캐싱해 두었다가 네이티브 코드로 직접 실행하는 방식이다.
하지만 바이트 코드를 Native Code로 변환하는 데는 비용이 들기 때문에 JVM의 모든 코드를 JIT 컴파일러 방식으로 실행하지 않고, 인터프리터 방식을 사용하다가 일정 기준이 넘어가면 JIT 컴파일러 방식으로 실행하는 식으로 진행 된다.

가비지 컬렉터 (Garbage Collector)

자바 가상 머신(JVM)은 가비지 컬렉터(Garbage Collector)를 이용하여 Heap 메모리 영역에서 사용하지 않는 메모리를 자동으로 회수해 준다.
자바는 이 가비지 컬렉터를 이용해 자동으로 메모리를 실시간 최적화 시켜주어 개발자가 따로 메모리 관리를 하지 않아도 되어 손쉽게 프로그래밍을 할 수 있게 도와준다.
가비지 컬렉터(GC)는 자동으로 실행되지만 실행되는 시간은 정해져 있지가 않다.

가비지 컬렉터의 단점
자동으로 메모리를 회수해준다 해도 메모리가 언제 해제되는지 정확하게 알 수 없어 제어하기 힘들다
가비지 컬렉터(GC)가 동작하는 동안에는 다른 동작을 멈추기 때문에 오버헤드가 발생되는 문제점이 있다.

런타임 데이터 영역 (Runtime Data Area)

런타임 데이터 영역(Runtime Data Area)은 JVM의 메모리 영역으로 자바 어플리케이션을 실행할 때 사용되는 데이터들을 적재하는 영역이다.
Method, Heap은 모든 스레드(Thread)가 공유하는 영역이고, 나머지 Stack, PC Register, Native Method Stack은 각 스레드(Thread)마다 생성되는 개별 영역이다.

메소드 영역 (Method Area)

메소드 영역은 JVM이 시작할 때 생성되는 공간으로 바이트코드(.class)를 처음 메모리 공간에 올릴 때 초기화 되는 대상을 저장하기 위한 메모리 공간이다.
JVM이 동작하고 클래스가 로드될 때 적재되서 프로그램이 종료될 때까지 저장된다.

[Runtime Constant Pool]

  • 메소드 영역에 존재하는 별도 관리 영역
  • 각 클래스/인터페이스 마다 별도의 Constant Pool 테이블이 존재하는데, 클래스 생성할 때 참조해야 할 정보들을 상수로 가지고 있는 영역
  • JVM은 Constant Pool을 통해 메소드나 필드의 실제 메모리 상 주소를 찾아 참조한다.

힙 영역 (Heap Area)

힙 영역은 JVM이 관리하는 프로그램 상에서 데이터를 저장하기 위해 런타임시 동적으로 할당하여 사용하는 영역이다.
new 연사자로 생성되는 클래스와 인스턴스 변수, 배열 타입 등 Reference Type이 저장되는 곳이다.
메소드 영역에 저장된 클래스만이 생성되어 적재된다.

힙 영역에 생성된 객체와 배열은 Reference Type으로 JVM 스택 영역의 변수나 다른 객체의 필드에서 참조된다.
힙의 참조 주소는 스택이 가지고 있고 해당 객체를 통해서만 힙 영역에 있는 인스턴스를 핸들링 할 수 있는 것이다.

참조하는 변수나 필드가 없으면 의미 없는 객체가 되기 때문에 이것을 쓰레기로 취급하고 JVM은 가비지 컬렉터(GC)를 실행시켜 쓰레기 객체를 힙 영역에서 자동으로 제거된다.

스택 영역 (Stack Area)

스택 영역은 int, long, boolean 등 기본 자료형을 생성할 때 저장하는 공간으로, 임시적으로 사용되는 변수나 정보들이 저장되는 영역이다.
자료구조 Stack은 마지막에 들어온 값이 먼저 나가는 LIFO 구조로 push와 popo 기능 사용방식으로 동작한다.

메소드 호출 시마다 각각의 스택프레임이 생성되고 메소드 안에서 사용되는 값들을 저장하고, 호출된 메소드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값을들 임시로 저장한다.

매개변수(parameter) : 함수를 정의할 때 사용되는 변수
지역변수(Local Variable) : 함수 내부에서만 선언된 변수
스택 프레임(stack frame)
메소드가 호출될 때마다 프레임이 만들어지며, 현재 실행중인 메소드 상태 정보를 저장하는 곳
메소드 호출 범위가 종료되면 스택에서 제거된다.

데이터 타입에 따라 스택(stack)과 힙(Heap)에 저장되는 방식이 다르다는 점을 유의해야 한다.
예를들어 Person p = new Person();와 같이 클래스를 생성할 경우, new에 의해 생성된 클래스는 Heap Area에 저장되고, Stack Area에는 생성된 클래스의 참조인 p만 저장된다.

스택 영역은 각 스레드(Thread)마다 하나씩 존재하며, 스레드(Thread)가 시작될 때 할당된다.
프로세스가 메모리에 로드 될 때마다 스택(Stack) 사이즈가 고정되어 있어 런타임 시에 스택(Stasck) 사이즈를 바꿀 수 없다.
고정된 크기의 JVM 스택에서 프로그램 실행 중 메모리 크기가 충분하지 않다면 StackOverFlowError가 발생.
스레드(Thread)가 종료되면 스택(Stack)도 사라진다.

PC 레지스터 (Program Counter Register)

PC 레지스터는 스레드가 시작될 때 생성되며, 수행중인 JVM 명령어 주소를 저장하는 공간이다.
JVM 명령의 주소는 스레드가 어떤 부분을 무슨 명령으로 실행해야 할지에 대한 기록을 가지고 있다.
자바의 PC Register는 위의 cpu Register와 다르다.
자바는 OS나 CPU의 입장에서는 하나의 프로세스이기 때문에 JVM의 리소스를 이용해야 한다.
자바는 CPU에 직접 연산을 수행하도록 하는 것이 아닌, 작업하는 내용을 CPU에게 연산으로 제공해야 하며 이를 위한 버퍼 공간으로 PC Register라는 메모리 영역을 만들게 된 것이다.

네이티브 메소드 스택 (Native Method Stack)

네이티브 메소드 스택은 자바 코드(.java)가 컴파일되어 생성되는 바이트 코드(.class)가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역이다.
자바 이외의 언어(C, C++, 어셈블리 등)로 작성된 네이티브 코드를 실행하기 위한 공간이기도 하다

일반적으로 메소드를 실행하는 경우 JVM 스택에 쌓이다가 해당 메소드 내부에 네이티브 방식을 사용하는 메소드가 있다면 해당 메소드는 네이티브 스택에 쌓인다.
네이티브 메소드가 수행이 끝나면 다시 자바 스택으로 돌아와 다시 작업을 수행한다.
네이티브 코드로 되어 있는 함수의 호출을 자바 프로그램 내에서도 직접 수행할 수 있고 그 결과를 받아올 수도 있는 것이다.

네이티브 메소드 스택은 네이티브 메소드 인터페이스(JNI)와 연결되어 있는데, JNI가 사용되면 네이티브 메소드 스택에 바이트 코드로 전환되어 저장하게 된다.

자바 네이티브 인터페이스 (Java Native Interface)

JNI는 자바가 다른 언어로 만들어진 어플리케잇현과 상호 작용할 수 있는 인터페이스 제공하는 프로그램이다.
JNI는 JVM이 Natice Method를 적재하고 수행할 수 있도록 한다.
하지만 실질적으로 제대로 동작하는 언어는 C / C++ 정도 밖에 없다고 한다.

네이티브 메소드 라이브러리 (Native Method Library)

C, C++로 작성된 라이브러리를 칭한다.
만일 헤더가 필요하면 JNI는 이 라이브러리를 로딩해 실행한다.

출처
인파 티스토리

0개의 댓글