자바 가상 머신은 자바 프로그램 실행환경을 만들어 주는 소프트웨어입니다. 자바 코드를 컴파일하여 .class 바이트 코드로 만들면 이 코드가 자바 가상 머신 환경에서 실행됩니다.
JVM은 자바 실행 환경 JRE(Java Runtime Environment)에 포함되어 있습니다. 운영체제에 맞는 JRE가 설치되어있으면 자바 프로그램을 실행시킬 수 있습니다.
개발자가 자바로 .java 코드를 작성하고 실행시키면
자바 컴파일러인 javac가 바이트코드인 .class 파일로 컴파일하여 변환합니다.
바이트 코드는 클래스 로더를 통해
JVM이 운영체제로부터 할당받은 메모리 영역인 Runtime Data Area로 적재합니다.
로딩된 .class 바이트 코드를 실행하는 Runtime Module은 Execution Engine입니다.
Executin Engine은 메모리에 적재된 자바 바이트 코드(클래스 파일)를 기계어로 변경해 명령어 단위로 읽어서 실행합니다.
Interpreter 방식은 바이트코드를 한 줄씩 해석, 실행하는 방식으로 느리고,
JIT(Just In Time) 컴파일 방식은 실행하는 시점에 각 OS에 맞는 Native Code로 변환하는 방식으로 속도가 빠르지만 비용이 소모되므로 인터프리터 방식을 사용하다가 일정 기준이 넘어가면 JIT 컴파일 방식으로 명령어를 실행합니다.
JVM의 Runtime Data Area는 5개의 메모리 영역으로 나눌 수 있습니다.
모든 스레드가 공유해서 사용
- 힙 영역 (Heap Area)
- 메서드 영역(Method Area)
스레드(Thread) 마다 하나씩 생성
- 스택 영역(Stack Area)
- PC 레지스터 (PC Register)
- 네이티브 메서드 스택(Native Method Stack
클래스 멤버 변수의 이름, 데이터 타입, 접근 제어자 정보와 같은 각종 필드 정보들과 메서드 정보, 데이터 Type 정보, Constant Pool, static변수, final class 등이 생성되는 영역입니다.
모든 스레드가 공유하는 영역이며, 클래스 로더에 의해 클래스가 로딩될 때 초기화됩니다.
런타임시 new 키워드로 동적으로 생성된 객체 객체 인스턴스와 배열이 할당되는 영역입니다.
가비지 컬렉션(Garbage Collection)이 이 영역에서 사용하지 않는 객체를 자동으로 정리합니다.
Heap Area는 효율적인 GC를 위해 위와 같이 크게 3가지의 영역으로 나뉘게 됩니다.
Young Generation 영역은 자바 객체가 생성되자마자 저장되고, 생긴지 얼마 안되는 객체가 저장되는 공간입니다. Heap 영역에 객체가 생성되면 최초로 Eden 영역에 할당됩니다. 그리고 이 영역에 데이터가 어느정도 쌓이게 되면 참조정도에 따라 Servivor의 빈 공간으로 이동되거나 회수됩니다.
Young Generation(Eden+Servivor) 영역이 차게 되면 또 참조정도에 따라 Old영역으로 이동 되게 되거나 회수됩니다. 이렇게 Young Generation과 Tenured Generation 에서의 GC를 Minor GC 라고 합니다. Old영역에 할당된 메모리가 허용치를 넘게 되면, Old 영역에 있는 모든 객체들을 검사하여 참조되지 않는 객체들을 한꺼번에 삭제하는 GC가 실행됩니다. 시간이 오래 걸리는 작업이고 이 때 GC를 실행하는 쓰레드를 제외한 모든 스레드는 작업을 멈추게 됩니다. 이를 'Stop-the-World' 라 합니다. 메모리가 클수록 Stop-the-World 시간도 길어집니다. 그리고 이렇게 'Stop-the-World'가 발생하고 Old영역의 메모리를 회수하는 GC를 Major GC라고 합니다.
지역변수, 파라미터, 리턴 값, 연산에 사용되는 임시 값 등이 생성되는 영역입니다.
Java Virtual Machine Stacks는 Thread가 시작될 때 생성되며, 각 Thread 별로 생성되기 때문에 다른 Thread는 접근할 수 없습니다.
메소드가 호출될 때마다 스택 프레임(Stack Frame)이 생성되어 지역 변수, 매개변수, 메소드 호출 및 복귀 주소 등이 저장됩니다. 메소드 호출이 끝나면 해당 스택 프레임이 제거됩니다.
Thread가 생성될 때마다 생성되는 영역으로 프로그램 카운터, 즉 현재 스레드가 실행되는 부분의 명령어의 주소를 저장하는 영역입니다. 스레드가 다음에 실행할 명령어를 가리키는 역할을 합니다.
PC Register는 Stack-Base로 동작합니다. 스택 프레임 내에서 메소드 호출이 발생할 때마다 새로운 PC Register 값이 생성되어 현재 수행 중인 명령어의 주소를 가리킵니다.
각 스레드마다 별도의 PC Register가 존재하므로 다중 스레드 환경에서 각각의 스레드가 독립적으로 메소드를 실행하고 스레드 간 전환 시에도 정확한 실행 흐름을 유지할 수 있게 해줍니다.
자바 이외의 언어(C, C++, 어셈블리 등)로 작성된 네이티브 코드를 실행할 때 사용되는 메모리 영역으로 일반적인 C 스택을 사용합니다.
보통 C/C++ 등의 코드를 수행하기 위한 스택을 말하며 (JNI) 자바 컴파일러에 의해 변환된 자바 바이트 코드를 읽고 해석하는 역할을 하는 것이 자바 인터프리터(interpreter)입니다.
가비지는 '정리되지 않은 메모리', '유효하지 않은 메모리 주소'를 말합니다. 주소를 잃어버려서 사용할 수 없는 메모리가 '정리되지 않은 메모리'입니다. 프로그래밍 언어에서는 Danling Object, 자바에서는 Garbage라고 부릅니다.
C++와 같은 다른 언어에서는 사용하지 않을 객체의 메모리를 직접 해제해주어야 하지만 자바는 GC가 잡아주니 개발자 입장에서는 편리하지만 모든 메모리 누수를 잡아주는 것은 아님으로 메모리 누수에 대한 경계를 늦추어서는 안됩니다.
가비지 컬렉션은 영어로 Garbeage Collection으로 줄여서 GC라고도 부릅니다. 가비지 컬렉션은 자바의 메모리 관리 방법 중의 하나로 JVM의 Heap 영역에서 동적으로 할당했던 메모리 영역 중 필요 없게 된 메모리 영역을 주기적으로 삭제하는 프로세스를 말합니다. C나 C++에서는 이러한 가비지 컬렉션이 없어 프로그래머가 수동으로 메모리 할당과 해제를 일일이 해줘야 하는 반면 Java는 JVM에 탑재되어 있는 가비지 컬렉터가 메모리 관리를 대행해주기 때문에 개발자 입장에서 메모리 관리, 메모리 누수(Memory Leak) 문제에서 대해 완벽하게 관리하지 않아도 되어 오롯이 개발에만 집중할 수 있다는 장점이 있습니다.
단점으로는 개발자가 메모리가 언제 해제되는지 정확하게 알 수 없고,
가비지 컬렉션(GC)이 동작하는 동안에는 다른 동작을 멈추기 때문에 오버헤드가 발생합니다.
GC가 너무 자주 실행되면 소프트웨어 성능 하락의 문제가 되기도 합니다.
가비지 컬렉션은 힙영역에서 이루어집니다.
객체 생성: 프로그램 실행 중에 객체들이 동적으로 생성됩니다. Heap 메모리에 객체들이 할당됩니다.
참조 체크: JVM은 객체들 간의 참조 관계를 추적합니다. 객체는 다른 객체에 의해 참조될 수 있습니다. 각 객체가 얼마나 많은 다른 객체에 의해 참조되는지를 확인합니다.
Reachability 분석: 루트(root) 객체들로부터 그래프 순회를 통해 참조 체인을 따라가며 각 객체가 도달 가능한지 확인합니다. 도달 가능한 객체들은 "존재하는" 객체로 간주됩니다.
Unreachable 객체 식별: Reachability 분석을 통해 도달 가능하지 않은 객체들이 식별됩니다. 이러한 객체들은 더 이상 사용되지 않는 객체로 간주됩니다. 이 단계에서 가비지 컬렉션의 대상이 되는 객체가 결정됩니다.
가비지 컬렉션 실행: 불필요한 객체들이 식별되면 JVM은 이러한 객체들을 해제하여 메모리를 반환합니다. 이 과정은 가비지 컬렉터(Garbage Collector)가 실행되어 수행됩니다.
메모리 반환: 가비지 컬렉터가 메모리를 반환하는 과정에서 객체가 차지하던 메모리 공간이 해제되고, 분산된 객체들을 Heap의 시작 주소로 모아 메모리가 할당된 부분과 그렇지 않은 부분으로 압축합니다. 사용 가능한 공간이 늘어납니다.
참고한 블로그 :