[Java] 자바 가상 머신(JVM)

최우형·2023년 3월 12일
1

Java

목록 보기
18/24

📌자바 가상 머신(JVM)?

JVM은 Java Virtual Machine으로 자바로 작성한 소스 코드를 해석해 실행하는 별도의 프로그램이다.

프로그램이 실행될 때 자원을 할당받아야 하는데 프로그램이 운영체제에게 필요한 컴퓨터 자원을 요청하는 방식이 운영체제마다 다르다.

JVM이 자바 프로그램과 운영체제 사이에서 일종의 통역가 역할을 수행해준다.

JVM 구조

자바 소스 코드를 작성하고 실행하면

  1. 컴파일이 진행된다.

  2. 컴파일의 결과로 .java 확장자를 가졌던 자바 소스코드가 .class 확장자를 가진 바이트 코드 파일로 변환된다.

  3. JVM은 운영 체제로부터 소스 코드 실행에 필요한 메모리를 할당받는다.
    (그것이 바로 위 그림 상의 런타임 데이터 영역(Runtime Data Area)이다.)

  4. 클래스 로더(Class Loader)가 바이트 코드 파일을 JVM 내부로 불러들여 런타임 데이터 영역에 적재시킨다. ( 자바 소스 코드를 메모리에 로드시키는 것 )

  5. 로드가 완료되면 실행 엔진(Execurion Engine)이 런타임 데이터 영역에 적재된 바이트 코드를 실행시킨다.

  6. 이 때 실행 엔진은 두 가지 방식으로 바이트 코드를 실행시킨다.

    1. 인터프리터(Interpreter)를 통해 코드를 한 줄씩 기계어로 번역하고 실행시키기

    2. JIT Compiler(Just-In-Time Compiler)를 통해 바이트 코드 전체를 기계어로 번역하고 실행시키기

실행 엔진은 기본적으로 1번의 방법을 통해 바이트 코드를 실행시키다가, 특정 바이트 코드가 자주 실행되면 해당 바이트 코드를 JIT Compiler를 통해 실행시킨다.

즉, 중복적으로 어떤 바이트 코드가 등장할 때, 인터프리터는 매 번 해당 바이트 코드를 해석하고 실행하지만, JIT 컴파일러가 동작하면 한 번에 바이트 코드를 해석하고 실행시킨다.


📌Stack과 Heap

JVM 메모리 구조

크게 5가지의 구조로 구분되어 있는데 Stack과 Heap을 알아보자.

Stack 영역이란?

스택은 일종의 자료구조이다. - 여기서 자료구조란 프로그램이 데이터를 저장하는 방식을 의미한다.

이러한 스택은 LIFO라는 키워드로 설명된다. LIFO는 "Last In First Out" 의 약자이다.
직역하면 마지막에 들어간 데이터가 가장 먼저 나온다는 의미이다.
ex)프링글스

Heap 영역이란?

JVM이 작동되면 이 영역은 자동 생성된다. 이 영역안에 객체나 인스턴스 변수, 배열이 저장된다.

Person person = new Person();

위 예시에서 new Person()이 실행되면 Heap 영역에 인스턴스가 생성되며, 인스턴스가 생성된 위치의 주소값을 person에게 할당해주는데, 이 person은 Stack 영역에 선언된 변수이다.

즉, 우리가 객체를 다룬다는 것은 Stack 영역에 저장되어 있는 참조 변수를 통해 Heap 영역에 존재하는 객체를 다룬다는 의미가 된다.

정리하자면, Heap 영역은 실제 객체의 값이 저장되는 공간이다.


📌Garbage Collection

가비지 컬렉션은 프로그램에서 더 이상 사용하지 않는 객체를 찾아 삭제하거나 제거하여 메모리를 확보하는 것을 의미한다.

예시
Person person = new Person();
person.setName("김코딩");
person = null; 
// 가비지 발생
person = new Person(); 
person.setName("박해커");

동작 방식

JVM의 Heap 영역은 객체는 대부분 일회성이며, 메모리에 남아 있는 기간이 대부분 짧다는 전제로 설계되어있다.

그렇기에 객체가 얼마나 살아있냐에 따라 Heap 영역 안에서 Young, Old 영역 이렇게 2가지로 나뉜다.

Young 영역에서는 새롭게 생성된 객체가 할당되는 곳이고, 많은 객체가 생성되었다 사라지는 것을 반복한다.

여기서 활동하는 가비지 컬렉터를 Minor GC라고 한다.

Old 영역은 Young 영역에서 상태를 유지하고 살아남은 객체들이 복사되는 곳으로 보통 Young 영역보다 크게 할당되고 크기가 큰 만큼 가비지는 적게 발생한다.

이 영역의 가비지 컬렉터를 Major GC라고 부른다.

Young과 Old의 영역은 서로 다른 메모리 구조로 되어있어 세부적인 동작은 다르지만 기본적으로 가비지 컬렉션이 실행될 때는 다음의 2가지 단계를 따른다.

  1. Stop The World
    Stop The World는 가비지 컬렉션을 실행시키기 위해 JVM이 애플리케이션의 실행을 멈추는 작업이다.

    가비지 컬렉터를 실행하는 스레드를 제외한 모든 스레드들의 작업은 중단되고, 가비지 정리가 완료되면 재개한다.

  2. Mark and Sweep
    Mark는 사용되는 메모리와 사용하지 않는 메모리를 식별하는 작업을 의미하며, Sweep은 Mark단계에서 사용되지 않음으로 식별된 메모리를 해제하는 작업을 의미한다.

즉, Stop The World를 통해 모든 작업이 중단되면, 가비지 컬렉션이 모든 변수와 객체를 탐색해서 각각 어떤 객체를 참고하고 있는지 확인한다.

이후, 사용되고 있는 메모리를 식별해서(Mark) 사용되지 않는 메모리는 제거(Sweep)하는 과정을 진행한다.

profile
프로젝트, 오류, CS 공부, 코테 등을 꾸준히 기록하는 저만의 기술 블로그입니다!

0개의 댓글