JVM

최강일·2024년 11월 25일

JVM(Java Virtual Machine)이란

자바 실행환경을 만들어 주는 s/w다.
os에 상관없이 어디서든 자바 애플리케이션을 실행할 수 있게 된다.
또한, 가비지 컬렉터를 사용한 메모리 관리도 자동으로 수행하며, 스택 기반으로 동작한다.

가상 머신을 구현하는데 2가지 종류가 있다

  • 스택 기반 VM : JVM이 해당하며 연산 할 때 스택을 사용한다.
  • 레지스터 기반 VM : 계산할 때 레지스터를 사용한다. (cpu의 레지스터)

JVM 구조

JVM 구조는 크게 3가지로 나뉜다.

  • Class Loader
  • Execution Engine
  • Runtime Data Area

1.Class Loader

JVM에 클래스파일(*.class)을 동적으로 로드하고, 링크를 통해 배치하여 Runtime Data Area(실질적인 메모리를 할당 받아 관리하는 영역)에 올리는 작업을 수행하는 모듈이다.

동적 로딩

한번에 메모리에 올리지 않고, 어플리케이션에서 필요한 경우 동적으로 메모리에 적재한다는 뜻

클래스 파일 로딩 순서

  1. Loading : 클래스 파일을 가져와서 untime Data Area에 로드한다.
  2. Linking : 클래스 파일을 사용하기 위해 검증하는 과정이다.
    1. verifying(검증) : 읽은 클래스가 JVM 명세대로 구성되었는지 검사
    2. preparing(준비) : 클래스가 필요로 하는 메모리를 할당
    3. Resolving(분석) : 클래스의 상수 풀 내 모든 심볼릭 레퍼런스를 다이렉트 레퍼런스로 변경
  3. Initialization : 클래스 변수들을 적절한 값으로 초기화한다.(ex. static 필드들을 설정된 값으로 초기화 등)

2.Execution Engine

클래스 로더를 통해 Runtime Data Areas에 배치된 바이트 코드를 명령어 단위로 읽어서 실행 한다.
자바 바이트 코드(*.class)는 기계가 바로 수행할 수 있는 언어보다는 가상머신이 이해할 수 잇는 중간 레벨로 컴파일 된 코드이다.
Execution Engine은 이와 같은 바이트 코드를 실제로 JVM 내부에서 기계가 실행할 수 있는 형태로 변경해준다.
여기서 Interpreter방식과 JIT compiler 방식을 혼합하여 바이트 코드를 실행한다.

  • Interpreter

    • 바이트 코드 명령어를 하나씩 읽어서 해석하고 바로 실행한다.
    • JVM안에서 바이트코드는 기본적으로 인터프리터 방식으로 동작한다.
    • 다만 같은 메소드라도 여러번 호출이 된다면 매번 해석하고 수행해야되서 전체적인 속도는 느리다.
  • JIT Compiler(Jst In Time Compiler)

    • 인터프리터 방식의 단점을 보완하기 위해 JIT 컴파일러가 도입되었다.
    • JIT 컴파일러는 반복되는 바이트코드를 컴파일하여 native code로 변환하여 사용한다. - 이후에는 해당 메서드를 더이상 인터프리팅 하지않고 캐싱해 두었다가 native code로 직접 실행하는 방식이다.
    • 즉, 한 번 컴파일된 코드는 빠르게 수행하게 되어 수행 속도가 빨라진다.
    • 하지만 컴파일하는 과정에 비용이 들게 된다. 따라서 한 번만 수행할 코드라면 컴파일하지 않고 인터프리팅 하는 것이 유리하다. 따라서 JVM은 인터프리터 방식을 사용하다가 일정한 기준이 넘어가면 JIT 컴파일러를 사용하는 혼합 방식을 사용한다.

    native code

    java에서 부모가 되는 C언어나 C++, 어셈블리어로 구성된 코드를 의미한다.

3.Runtime Data Area

JVM이 프로그램을 수행하기 위해 OS로부터 별도로 할당받은 메모리 공간을 말한다.

크게 Method area, Heap area, Stack area, PC Register, Native Method Stack으로 나뉜다.
Method area, Heap area는 모든 쓰레드가 공유하는 영역이고, 나머지 Stack area,PC Register, Native Method Stack은 각 쓰레드 마다 생성되는 개별 영역이다.

Method(Static) 영역

JVM이 시작될 때 생성되는 공간으로 바이트 코드(.class)를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 메모리 공간이다.
JVM이 동작하고 클래스가 로드될 때 적재되서 프로그램이 종료될 때까지 저장된다.
요약하자면 Method 영역에서는 정적 필드와 클래스 구조만을 가진다.

모든 쓰레드가 공유하는 영역이라 다음과 같은 정보들이 저장되게 된다.

  • Field info : 멤버 변수의 이름, 데이터 타입, 접근 제어자의 정보
  • Method info : 메서드 이름, return 타입, 함수 매개변수, 접근 제어자의 정보
  • Type info : Class인지 Interface인지 여부 저장, type의 속성, 이름 Super Class의 이름

Heap 영역

Method 영역과 함께 모든 쓰레드가 공유하며, 런타임 시 동적으로 할당하여 사용하는 영역이다.
즉, new 연산자로 생성되는 클래스와 인스턴스 변수, 배열 타입 등 Reference Type이 저장되는 곳이다.

gc 대상 조건

유의할점은 Heap 영역에 생성된 객체와 배열은 Reference Type으로, JVM Stack 영역의 변수나 다른 객체의 필드에서 참조된다는 점이다.
즉, Heap의 참조 주소는 "Stack"이 갖고 있고 해당 객체를 통해서만 Heap 영역에 있는 인스턴스를 핸들링할 수 있다.
만약 참조하는 변수나 필드가 없다면 의미 없는 객체가 되기 때문에, JVM은 Garbage Collector를 실행시켜 Heap영역에서 제거된다.
이처럼 Heap 영역은 Garbage Collection에 대상이 되는 공간이다.

Heap의 5가지 영역

그리고 효율적인 Garbage Collection을 수행하기 위해서 세부적으로 5가지 영역으로 나뉘게 된다.
5가지 영역으로 나뉜 Heap 영역은 다시 물리적으로 Young Generation, Old Generation 영역으로 구분된다.

  • Young Generation : 생명 주기가 짧은 객체를 GC대상으로 하는 영역
    • Eden : new를 통해 새로 생성된 객체가 위치. 정기적인 GC 후 살아남은 객체들은 Survivor로 이동
    • Survivor 0 / Survivor 1 : 각 영역이 채워지게 되면, 살아남은 객체는 비워진 Survivor로 순차적으로 이동
  • Old Generation : 생명 주기가 긴 객체를 GC 대상으로 하는 영역. Youn Generation에서 마지막까지 살아남은 객체가 이동

Stack 영역

기본 자료형 타입 (boolean, char, short, int, long, float, double) 의 데이터가 값이랑 같이할당이 되고, 또 Heap 영역에 생성된 Object 타입의 데이터의 참조 값이 할당 된다.
즉, 임시적으로 사용되는 변수나 정보들이 저장되는 영역이다.
LIFO구조로 push와 pop기능 사용방식으로 동작한다.

메서드 호출 시마다 각각의 스택 프레임(그 메서드만을 위한 공간)이 생성되고 메서드 안에서 사용되는 값들을 저장하고, 호출된 메서드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값들을 임시로 저장된다.
그리고 메서드 수행이 끝나면 프레임별로 삭제된다.

스택 프레임

메소드가 호출될 때마다 프레임이 만들어지며, 현재 실행중인 메소드 상태 정보를 저장하는 곳이다.
메서드 호출 범위가 종료되면 스택에서 제거된다.
스택 프레임에 쌓이는 데이터는 메서드의 매개변수, 지역변수, 리턴값, 연산시 결과값 등이 있다.

PC Register

쓰레드가 시작될 때 생성되며, 현재 수행중인 JVM 명령어 주소를 저장하는 공간이다.
JVM 명령의 주소는 쓰레드가 어떤 부분을 무슨 명령으로 실행해야할 지에 대한 기록을 가지고 있다.

일반적으로 CPU에서 명령을 수행할 때, 연산하는 동안 필요한 정보를 레지스터라고 하는 CPU 내의 기억장치를 이용한다.
하지만 자바의 PC Register는 CPU의 Register와 다르다.

자바는 OS나 CPU의 입장에서는 하나의 프로세스이기 때문에 가상 머신(JVM)의 리소스를 이용해야 한다.
그래서 자바는 CPU에 직접 연산을 수행하도록 하는 것이 아닌, 현재 작업하는 내용을 CPU에게 연산으로 제공해야 하며, 이를 위한 버퍼 공간으로 PC Register라는 메모리 영역을 만들게 된 것이다.

만약에 스레드가 자바 메소드를 수행하고 있으면 JVM 명령(Instruction)의 주소를 PC Register에 저장한다.
그러다 만약 자바가 아닌 다른 언어(C언어, 어셈블리)의 메소드를 수행하고 있다면, undefined 상태가 된다.
왜냐하면 자바에서는 이 두 경우를 따로 처리하기 때문이다.
이 부분이 바로 뒤에 언급하게 될 Native Method Stack 공간이다.

Native Method Stack

자바 외의 언어로 작성된 네이티브 코드들을 위한 스택이다.
Java Native Interface를 통해 호출되는 C/C++ 등의 코드를 수행한다.

java 코드가 컴파일되어 생성되는 바이트 코드가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역이다.
또한 java 이외의 언어(C,C++ 등)로 작성된 Native code를 실행하기 위한 공간이기도 하다.
위에서 언급한 JIT 컴파일러에 의해 변환된 Native code 역시 여기에서 실행이 된다고 보면 된다.

네이티브 메소드 스택은 네이티브 메소드 인터페이스(JNI)와 연결되어 있는데, JNI가 사용되면 네이티브 메서드 스택에 바이트 코드로 전환되어 저장되게 된다.

JNI

자바가 다른 언어로 만들어진 어플리케이션과 상호 작용할 수 있는 인터페이스 제공하는 프로그램이다.

JNI(Java Native Interface)

java가 다른 언어로 만들어진 애플리케이션과 상호 작용할 수 있는 인터페이스를 제공하는 프로그램이다.
JVM이 native method를 적재하고 수행할 수 있도록한다.

Native Method Library

c,c++로 작성된 라이브러리다.

4.Garbage Collector

더이상 사용하지 않는 Heap 메모리를 자동으로 정리해주는 역할을 한다.
즉, GC(Garbage Collection)를 담당한다.

C언어 같은 경우 개발자가 직접 메모리를 해제해줘야 되지만, java는 garbage collector를 이용해 자동으로 메모리를 실시간 최적화 시켜준다.
따라서 개발자가 따로 메모리를 관리하지 않아도 되므로, 더욱 손쉽게 프로그래밍을 할 수 있도록 도와준다.

stop the world

Full GC가 발생하면 GC를 제외한 모든 스레드가 중지되기 때문에 장애가 발생할 수 있다.
수동으로 GC 실행하는 System.gc()라는 메서드는 실제 실행을 보장하진 않는다.

C나 C++에서는 OS레벨의 메모리에 직접 접근하여 free(),malloc() 이라는 메서드를 호출하여 해제해준다.
반면 자바는 OS의 메모리 영역에 직접적으로 접근하지 않고 JVM 이라는 가상머신을 이용해서 간접적으로 해제해준다.

JVM 동작 방식

  1. 자바 프로그램을 실행하면 JVM은 OS로부터 메모리를 할당받는다.
  2. 자바 컴파일러(javac)가 자바 소스코드(.java)를 자바 바이트 코드(.class)로 컴파일 한다.
  3. Class Loader는 동적 로딩을 통해 필요한 클래스들을 로딩 및 링크 하여 Runtime Data Area(실질적인 메모리를 할당 받아 관리하는 영역)에 올린다.
  4. Runtime Data Area에 로딩 된 바이트 코드는 Execution Engine을 통해 해석된다.
  5. 이 과정에서 Execution Engine에 의해 Garbage Collector의 작동과 Thread 동기화가 이루어진다.

출처

[1]https://inpa.tistory.com/entry/JAVA-%E2%98%95-JVM-%EB%82%B4%EB%B6%80-%EA%B5%AC%EC%A1%B0-%EB%A9%94%EB%AA%A8%EB%A6%AC-%EC%98%81%EC%97%AD-%EC%8B%AC%ED%99%94%ED%8E%B8
[2]https://lsj31404.tistory.com/105

JVM 동작방식 첨부사진

출처 : https://javatutorial.net/jvm-explained

profile
Search & Backend Engineer

0개의 댓글