가비지 컬렉션이란 프로그램에서 더 이상 사용하지 않는 메모리를 자동으로 정리하는 것이다. 동적 할당된 메모리 영역 가운데 이상 사용하지 않는 영역을 탐지해 자동으로 해지하여 메모리 누수를 막을 수 있다. 이 기능을 가진 언어(혹은 엔진)는 자바, C#, 자바스크립트 등이 있다. C언어는 없다. 손수 해제 시켜줘야 한다. free~
대부분의 가비지 컬렉팅 기법은 트레이싱(tracing) 방식을 사용한다. 트레이싱 방식은 한 개 이상의 변수가 접근 가능한 메모리는 앞으로 사용할 수 있는 메모리로 간주하고, 그 밖의 메모리를 해제하는 방식을 가리킨다. 트레싱 방식 중 하나가 마크 앤 스윕(mark and sweep)이다. 일부는 가비지 컬렉팅 기법으로 참조 카운팅 방식을 사용한다.
한 객체에 flag를 두고, 가비지 컬렉션 사이클마다 flag에 표시 후 삭제하는 mark and sweep 방법이다.
객체에 in-use flag를 두고, 사이클마다 메모리 관리자가 모든 객체를 추적해서 사용 중인지 아닌지를 표시(mark)한다.
그리고나서 표시되지 않은 객체를 삭제(sweep)하는 단계를 통해 메모리를 해제한다.
한 객체를 참조하는 변수의 수를 추적하는 방법이다. 객체를 참조하는 변수는 처음에는 특정 메모리에 대해 레퍼런스가 하나뿐이지만, 변수의 레퍼런스가 복사될 때마다 레퍼런스 카운트가 늘어난다. 객체를 참조하고 있던 변수의 값이 바뀌거나, 변수 스코프를 벗어나면 레퍼런스 카운트는 줄어든다.
레퍼런스 카운트가 0이 되면 아무도 그 객체에 대한 레퍼런스를 가지고 있지 않다는 말과 같으므로, 그 객체와 관련한 메모리는 비울 수 있다.
🤔 크롬 브라우저 및 node.js의 v8 엔진은 어떻게 가비지 컬렉팅을 하고 있을까?
Memory terminology
V8 엔진(자바스크립트, NodeJS, Deno, WebAssembly) 내부의 메모리 관리 시각화하기
자주 사용하는 데이터나 많은 시간이나 연산이 필요한 작업의 결과를 저장해두는 것을 의미한다. 컴퓨팅에서 캐시는 일반적으로 일시적인(temporarily) 데이터를 저장하기 위한 목적으로 존재하는 고속의 데이터 저장 공간이다. 첫 작업 이후에 이 데이터에 대한 요청이 있을 경우, 데이터의 기본 저장 공간에 접근할 때보다 더 빠르게 요청을 처리할 수 있다. 따라서 캐싱을 사용하면 이전에 검색하거나 계산한 데이터를 효율적으로 재사용할 수 있다.
캐시의 데이터는 일반적으로 RAM(Random Access Memory)과 같이 빠르게 액세스할 수 있는 하드웨어에 저장되며, 소프트웨어 구성 요소와 함께 사용될 수도 있다. 캐시의 주요 목적은 기본 스토리지 계층(SSD, HDD)에 액세스하여 데이터를 가져오는 작업을 줄임으로써 더 빠르게 요청을 처리할 수 있어 데이터 검색의 성능을 높이는 것이다.
속도를 위해 용량을 절충하는 캐시는 일반적으로 데이터의 하위 집합을 일시적으로 저장한다. 완전하고 영구적인 데이터가 있는 데이터베이스와는 대조적이다.
🤔 웹서비스에서 캐시가 적용되는 예
- 클라이언트: HTTP 캐시 헤더, 브라우저
- 네트워크: DNS 서버, HTTP 캐시 헤더, CDN, 리버스 프록시
- 서버 및 데이터베이스: 키-값 데이터 스토어(e.g. Redis), 로컬 캐시(인-메모리, 디스크)