프로그램을 개발 하다보면 유효하지 않은 메모리인 Garbage가 발생하게 된다. C언어에서는 free()라는 함수를 이용하여 직접 메모리를 해제 해주지만 Java에서는 개발자가 직접 메모리를 해제 해주는 일이 없다. 그 이유는 JVM의 Garbage Collector가 불필요한 메모리를 알아서 정리 해주기 때문이다.
대신 Java에서는 명시적으로 불필요한 데이터를 표현하기 위해서 일반적으로 null을 선언해준다.
Person person = new Person();
person.setName("Old");
person = null;
// 가비지 발생
person = new Person();
person.setName("New");
기존의 Old는 더 이상 참조를 하지 않고 사용이 되지 않아서 Garbage Collector가 주기적으로 검사하여 메모리를 청소해준다.
JVM의 Heap 영역은 두 가지 가설 하에 만들어졌다.
이러한 가설을 'Weak Generational Hypothesis'라 한다.
이 가설의 장점을 살리기 위해 JVM의 Heap 영역에는 두 개의 영역이 존재한다.
Young 영역 (Young Generation)
Old 영역 (Old Generation)
Old 영역이 Young 영역보다 크게 할당되는 이유는 Young 영역의 수명이 짧은 객체들은 큰 공간을 필요로 하지 않으며 큰 객체들은 Young 영역이 아니라 바로 Old 영역에 할당되기 때문이다.
예외적인 상황으로 Old 영역에 있는 객체가 Young 영역의 객체를 참조하는 경우도 존재할 것이다. 이러한 경우를 대비하여 Old 영역에는 512 bytes의 덩어리(Chunk)로 되어 있는 카드 테이블(Card Table)이 존재한다.

카드 테이블에는 Old 영역에 있는 객체가 Young 영역의 객체를 참조할 때 마다 그에 대한 정보가 표시된다. 카드 테이블이 도입된 이유는 간단한다. Young 영역에서 가비지 컬렉션(Minor GC)가 실행될 때 모든 Old 영역에 존재하는 객체를 검사하여 참조되지 않는 Young 영역의 객체를 식별하는 것이 비효율적이기 때문이다. 그렇기 때문에 Young 영역에서 가비지 컬렉션이 진행될 때 카드 테이블만 조회하여 GC의 대상인지 식별할 수 있도록 하고 있다.
Young 영역과 Old 영역은 서로 다른 메모리 구조로 되어 있기 때문에, 세부적인 동작 방식은 다르다. 하지만 기본적으로 가비지 컬렉션이 실행된다고 하면 다음의 2가지 공통적인 단계를 따르게 된다.
Java에서 프로그램 코드를 작성할 때는 메모리를 명시적으로 지정하여 해제하지 않는다. 가끔 명시적으로 해제하려고 해당 객체를 null로 지정하거나 System.gc() 메서드를 호출하기도 한다. null로 지정하는 것은 큰 문제가 안되지만 System.gc() 메서드는 프로그램 성능에 매우 큰 영향을 끼치기 때문에 절대로 사용하면 안된다.
Mark : 사용되는 메모리와 사용되지 않는 메모리를 식별하는 작업
Sweep : Mark 단계에서 사용되지 않음으로 식별된 메모리를 해제하는 작업
stop-the-world를 통해 모든 작업을 중단시키면, GC는 스택의 모든 변수 또는 Reachable 객체를 스캔하면서 각각이 어떤 객체를 참고하고 있는지를 탐색하게 된다. 그리고 사용되고 있는 메모리를 식별하는데, 이러한 과정을 Mark라고 한다. 이후에 Mark가 되지 않은 객체들을 메모리를 제거하는데, 이러한 과정을 Sweep이라 한다.
Minor GC를 정확히 이해하기 위해서는 Young 영역의 구조에 대해 이해를 해야한다. Young 영역은 1개의 Eden 영역과 2개의 Survivor 영역, 총 3가지로 나뉘어 진다.
객체가 새롭게 생성되면 Young 영역 중에서도 Eden 영역에 할당이 된다. 그리고 Eden 영역이 꽉 차면 Minor GC가 발생하는데, 사용되지 않은 메모리가 해제되고 Eden 영역에 존재하는 객체는 Survivor 영역으로 옮겨지게 된다. Survivor 영역은 총 2개 이지만 반드시 1개의 영역에만 데이터가 존재해야 하는데, Young 영역의 동작 순서를 보면
객체의 생존 횟수를 카운트 하기 위해 Minor GC에서 객체가 살아남은 횟수를 의미하는 Age를 Object Header에 기록한다. 그리고 Minor GC 때 Object Header에 기록된 age를 보고 Promotion 여부를 결정한다.
또한 Survivor영역 중 1개는 반드시 사용이 되어야한다. 만약 두 Survivor 영역에 모두 데이터가 존재하거나, 모두 사용량이 0이라면 현재 시스템이 정상적인 상황이 아님을 파악할 수 있다.

Young 영역에서 오래 살아남은 객체는 Old 영역으로 Promotion됨을 확인할 수 있었다. 그리고 Major GC는 객체들이 계속 Promotion되어 Old 영역의 메모리가 부족해지면 발생하게 된다. Young 영역은 일반적으로 Old 영역보다 크키가 작기 때문에 GC가 보통 0.5초에서 1초 사이에 끝난다. 그렇기 때문에 Minor GC는 애플리케이션에 크게 영향을 주지 않는다. 하지만 Old 영역은 Young 영역보다 크며 Young 영역을 참조할 수도 있다. 그렇기 때문에 Major GC는 일반적으로 Minor GC보다 시간이 오래걸리며, 10배 이상의 시간을 사용한다.
