가비지 컬렉터(GC)?

yeezze·2022년 7월 11일
0

Java

목록 보기
2/3

가비지 컬렉터란? (Garbage Collector)

가바지 컬렉션은 자바의 메모리 관리 방법 중의 하나로 JVM의 Heap 영역에서 동적으로 할당했던 메모리 영역 중 필요 없게된 메모리 영역을 주기적으로 삭제하는 프로세스를 말한다.

가비지는 '정리되지 않은 메모리', '유효하지 않은 메모리 주소'를 말한다.

String[] arr = new String[2];

arr[0] = '0';
arr[1] = '1';

arr = new String[]{'G', 'C'};

위 코드에서 배열에 할당한 0과 1은 주소를 잃어버려서 사용할 수 없는 메모리이다.
-> 정리되지 않은 메모리 (java Garbage)

추가로 앞으로 사용하지 않고 메모리를 가지고 있는 객체 역시 Garbage에 포함된다.

C++과 같은 다른 언어에서는 사용하지 않을 객체의 메모리를 직접 해제해주어야 하지만 자바는 JVM의 GC가 알아서 불필요한 메모리를 정리해주기 때문에 개발자 입장에서는 편리하다. 다만 모든 메모리 누수를 잡아주는 것은 아님으로 메모리 누수에 대한 경계를 늦추어서는 안된다.

Java에서는 개발자가 프로그램 코드로 메모리를 명시적으로 해제하지 않기 때문에 가비지 컬렉터가 더 이상 필요 없는 (쓰레기) 객체를 찾아 지우는 작업을 한다. 개발자가 명시적으로 지우고 싶다면 일반적으로 null을 선언해준다.

Person person = new Person();
person.setName("A");
person = null;

// 가비지 발생
person = new Person();
person.setName("B");

기존에 A로 생성된 person 객체는 더이상 참조를 하지 않고 사용이 되지 않아서 Garbage가 되었다.

Minor GC와 Major GC

JVM의 Heap 영역은 처음 설계될 때 2가지 전제로 설계되었다.

  • 대부분의 객체는 금방 접근 불가능한 상태(Unreachable)가 된다.
  • 오래된 객체에서 새로운 객체로의 참조는 아주 적게 존재한다.

즉, 객체는 대부분 일회성되며, 메모리에 오랫동안 남아있는 경우는 드물다는 것이다.

그렇기 때문에 객체의 생존 기간에 따라 물리적인 heap 영역을 나누게 되었고 young, old 총 2가지 영역으로 설계되었다.

Young 영역 (Young Generation)

  • 새롭게 생성된 객체가 할당(Allocation)되는 영역
  • 대부분의 객체가 금방 Unreachable 상태가 되기 때문에, 많은 객체가 Young 영역에 생성되었다가 사라진다.
  • Young 영역에 대한 가비지 컬렉션(Garbage Collection)을 Minor GC라고 부른다.

Old 영역 (Old Generation)

  • Young 영역에서 Reachable 상태를 유지하여 살아남은 객체가 복사되는 영역
  • Young 영역보다 크게 할당되며, 영역의 크기가 큰 만큼 가비지는 적게 발생한다. (Eden 영역도 클테니까)
  • Old 영역에 대한 가비지 컬렉션을 Major GC 또는 Full GC라고 부른다.

Reachable : 객체가 참조되고 있는 상태
Unreachable : 객체가 참조되고 있지 않은 상태 (GC의 대상)

GC의 동작 방식

  1. Stop The World
  2. Mark and Sweep

1. Stop The World

GC 실행을 위해 JVM이 애플리케이션 실행을 멈추는 것이다. GC가 실행될 때는 GC를 실행하는 쓰레드를 제외한 모든 쓰레드들의 작업이 중단되고, GC가 완료되면 작업이 재개된다. 당연히 모든 쓰레드들의 작업이 중단되면 애플리케이션이 멈추기 때문에, GC의 성능 개선을 위해 튜닝을 한다고 하면 보통 stop the world의 시간을 줄이는 작업을 하는 것이다. 또한 JVM에서도 이러한 문제를 해결하기 위해 다양한 실행 옵션을 제공하고 있다.

2. Mark and Sweep

  • Mark : 사용되는 메모리와 사용되지 않는 메모리를 식별하는 작업
  • Sweep : Mark 단계에서 사용되지 않음으로 식별된 메모리를 해제하는 작업
    식별 후 해제

Stop the world를 통해 모든 작업을 중단시키면, GC는 스택의 모든 변수 또는 Reachable 객체를 스캔하면서 각각이 어떤 객체를 참고하고 있는지를 탐색하게 된다. 그리고 사용되고 있는 메모리를 식별하는데, 이러한 과정은 Mark라고 한다. 이후에 Mark가 되지 않은 객체들을 메모리에서 제거하는데, 이러한 과정을 Sweep라고 한다.

Minor GC의 동작 방식

Young 영역은 1개의 Eden 영역과 2개의 Survivor 영역, 총 3가지로 나뉘어진다.

  • Eden : 새로 생성된 객체가 할당(Allocation)되는 영역
  • Survivor : 최소 1번의 GC 이상 살아남은 객체가 존재하는 영역

객체가 새롭게 생성되면 Eden 영역에 할당된다. 그리고 Eden 영역이 꽉차면 Minor GC가 발생하게 되는데, 사용되지 않는 메모리는 해제되고 Eden 영역에 존재하는 객체는(사용중인) Survivor 영역으로 옮겨지게 된다. Survivor 영역은 총 2개이지만 반드시 1개의 영역에만 데이터가 존재해야 한다.

Young 영역의 동작 순서

  1. 새로 생성된 객체가 Eden 영역에 할당된다.
  2. 객체가 계속 생성되어 Eden 영역이 꽉차게 되고 Minor GC가 실행된다.
    • Eden 영역에서 사용되지 않는 객체의 메모리가 해제된다.
    • Eden 영역에서 살아남은 객체는 1개의 survivor 영역으로 이동된다.
  3. 1~2번의 과정이 반복되다가 Survivor 영역이 가득 차게 되면 Survivor 영역의 살아남은 객체를 다른 Survivor 영역으로 이동시킨다. (1개의 Survivor 영역은 반드시 빈 상태가 된다.)
  4. 이러한 과정을 반복하여 계속해서 살아남은 객체는 Old 영역으로 이동(Promotion)된다.

Major GC의 동작 방식

Young 영역에서 오래 살아남은 객체는 Old 영역으로 Promotion됨을 확인할 수 있었다. 그리고 Major GC는 객체들이 계속 Promotion되어 Old 영역의 메모리가 부족해지면 발생하게 된다. Young 영역은 일반적으로 Old 영역보다 크기가 작기 때문에 GC가 보통 0.5초에서 1초 사이에 끝난다. 그렇기 때문에 Minor GC는 애플리케이션에 크게 영향을 주지 않는다. 하지만 Old 영역은 Young 영역보다 크며 Young 영역을 참조할 수도 있다. 그렇기 때문에 Major GC는 일반적으로 Minor GC보다 시간이 오래걸리며, 10배 이상의 시간을 사용한다.

출처

https://velog.io/@litien/가비지-컬렉터GC
https://d2.naver.com/helloworld/1329
https://d2.naver.com/helloworld/329631
https://mangkyu.tistory.com/118

profile
백엔드 개발자 😊

0개의 댓글