JVM의 구조에 대해 알아보기

ideafy·2025년 2월 25일

CS

목록 보기

9/17

자바 가상 머신 Java Virtual Machine, JVM은 자바 애플리케이션을 클래스 로더를 통해 읽어 자바 API와 함께 실행하는 것이다.

JVM이 자바 소스파일 (.java)을 읽는 방법

자바 프로그램을 실행하면 JVM이 OS로부터 메모리를 할당 받는다.
자바 컴파일러 (javac)가 자바 소스코드(.java)를 자바 바이트 코드(.class)로 컴파일 한다.
javac이 .java를 .class로 컴파일 하는 이유
- 작성한 코드를 1차원적으로 숨김
- 바이트 코드로 컴파일 하면서 이후에는 문법 검사를 생략하여 시간을 단축
  -> 소스코드 변경 시 마다 컴파일을 하기 때문에 시간이 걸린다.
바이트 코드(.class)는 Class Loader가 JVM 메모리 영역 (Runtime Data Area)로 로딩시킨다.
Runtime Data Area에 로딩된 바이트 코드(.class)는 Execution Engine을 통해 해석된다.
이 과정에서 Execution Engine에 의해 Garbage Collector의 작동과 Thread의 동기화가 이뤄진다.

Class Loader

JVM 내로 바이트 코드(.class)를 동적으로 로드하고, 링크를 통해 배치하는 작업을 수행하는 모듈이다.
간단히 말해서 로드된 바이트 코드(.class)들을 Runtime Data Area에 배치한다.

바이트 코드(클래스 파일)를 로딩할 때는 어플리케이션에서 필요할 때마다 동적으로 로딩한다.

클래스 파일의 로딩 순서
Loading -> Linking -> Initialization

Loading: 클래스 파일을 가져와서 JVM의 메모리에 로드한다.

Linking: 클래스 파일을 사용하기 위해 검증하는 과정.
2-1. Verfying: 읽어들인 클래스가 JVM 명세에 명시된 대로 구성되어 있는지 검사한다.
2-2. Preparing: 클래스가 필요로 하는 메모리를 할당한다.
2-3. Resolving: 클래스의 상수 풀 내 모든 심볼릭 레퍼런스를 다이렉트 레퍼런스로 변경한다.

Initialization: 클래스 변수들을 적절한 값으로 초기화한다. (ex. static 필드들을 설정된 값으로 초기화 등)

Excution Engine

Excution Engine은 Class Loader를 통해 런타임 데이터 영역에 배치된 바이트 코드(.class)를 명령어 단위로 읽어서 실행한다.

바이트 코드(.class)는 기계가 바로 수행할 수 있는 언어보다는 가상머신이 이해할 수 있는 중간 레벨로 컴파일된 코드다.

그러므로, Excution Engine은 바이트 코드(.class)를 실제로 JVM 내부에서 기계가 실행할 수 있는 형태로 변경해준다.
이 과정에서 Excution Engine은 인터프리터와 JIT 컴파일러 방식을 혼합하여 바이트 코드를 실행한다.

인터프리터 (Interpreter)

바이트 코드 명령어를 하나씩 읽어서 해석하고 바로 실행한다.

JVM 안에서 바이트 코드는 기본적으로 인터프리터 방식으로 동작한다.
인터프리터 방식으로 동작하면 같은 메소드라도 호출될 때마다 매번 해석하고, 수행되기 때문에 속도가 느리다는 단점이 있다.

JIT 컴파일러 (Just In Time Compiler)

인터프리터의 단점을 보완하기 위해 JIT 컴파일러는 반복되는 코드를 발견하면 바이트 코드 전체를 컴파일 하여 Native Code로 변경하고 이후에는 해당 메서드를 더 이상 인터프리팅하지 않고 캐싱해두었다가 네이티브 코드로 직접 실행하는 방식이다.

하나씩 인터프리팅하여 실행하는 것이 아니라, 컴파일된 네트워크 코드를 실행하는 것이기 때문에, 전체적인 실행속도는 인터프리팅 방식보다 빠르다.

하지만 바이트 코드를 Native Code로 변환하는 데도 비용이 소모되므로, JVM은 모든 코드를 JIT 컴파일러 방식으로 실행하지 않고, 인터프리터 방식을 사용하다 일정 기준이 넘어가면 JIT 컴파일러 방식으로 명령어를 실행하는 식으로 진행한다.

가비지 컬렉터 (Garbage Collector, GC)

JVM은 가비지 컬렉터를 이용하여 Heap 메모리 영역에서 더 이상 사용되지 않는 메모리를 자동으로 회수한다.

개발자가 직접 메모리를 해제하는 C언어와 달리 JVM에서는 가비지 컬렉터를 이용해 자동으로 메모리를 최적화해주는 것이 특징이라고 할 수 있다.
일반적으로 자동으로 실행되지만, 가비지 컬렉터가 실행되는 시간은 정해져있지 않다.

Runtime Data Area

Runtime Data Area는 모든 스레드가 공유하는 Method Area, Heap이 있고, 각 스레드마다 하나씩 생성되는 Stack, PC Register, Native Method Stack이 있다.

메서드 영역 (Method Area)

JVM이 시작될 때 생성되고, 바이트 코드(.class)가 저장되는 영역이다.
Method Area는 JVM이 동작하고 클래스가 로드될 때 적재돼서 프로그램이 종료될 때까지 저장한다.

모든 스레드가 공유하므로 클래스 정보, 변수 정보, static으로 선언한 변수가 저장되는 공간이다.

간단히 말해서 Method Area에는 정적 필드와 클래스 구조만을 갖고 있다.

Runtime Contant Pool

Method Area에 존재하는 별도의 관리 영역으로 각 클래스/인터페이스 마다 별도의 contant pool이 존재하는데, 클래스를 생성할 때 참조해야 할 정보들을 상수로 가지고 있는 영역이다.

JVM은 contant pool을 통해 해당 메소드나 필드의 실제 메모리 상 주소를 찾아 참조한다.
상수 자료형을 저장하여 참조하고 중복을 방지하는 역할을 한다.

힙 영역 (Heap Area)

JVM이 관리하는 프로그램 상에서 데이터를 저장하기 위해 런타임 시 동적으로 할당하여 사용하는 영역이다.
Method Area에 저장된 클래스를 대상으로 new 연산자를 통해 동적으로 생성되는 클래스의 객체와 인스턴스 변수, 배열 타입 등 Reference Type이 저장되는 영역이다. (Method Area에 클래스, 변수 정보가 저장되어 있기 때문)

동적으로 생성한 객체나 변수는 소멸되기 전이나 GC가 회수하기 전까지는 Heap 영역에 저장된 상태이다.

Heap 영역에서 생성된 객체와 배열은 Reference Type으로써, JVM 스택 영역의 변수나 다른 객체의 필드에서 참조된다.
즉, Heap의 참조 주소는 스택이 갖고 있고 해당 객체를 통해서만 Heap 영역에 있는 인스턴스를 핸들링할 수 있는 것이다.

참조되는 변수나 필드가 없다면 JVM은 GC를 실행시켜 힙 영역에서 자동으로 제거한다.