Vacuum Monitoring

nTels_Tarzan·2025년 4월 30일

VACUUM이 중요한 이유

PostgreSQL은 내부적으로 MVCC (Multi-Version Concurrency Control) 라는 트랜잭션 관리 방식을 사용합니다.

MVCC는 데이터를 수정하거나 삭제할 때 기존 데이터를 곧바로 삭제하지 않고, 새로운 버전을 만들어 저장합니다.

이 죽은 튜플은 디스크 공간을 차지하고, 쿼리 성능을 저하시킵니다.

그래서 PostgreSQL은 이를 주기적으로 "청소"해야 하는데, 이게 바로 VACUUM입니다.

PostgreSQL은 autovacuum 프로세스를 통해 백그라운드에서 자동으로 VACUUM을 수행합니다.

하지만 모든 상황에서 충분하지 않을 수 있습니다.

상황	Autovacuum 한계
대량 업데이트 / 삭제	autovacuum이 너무 늦게 실행되어 성능 저하 발생
대용량 테이블	autovacuum이 완료되기 전에 다시 트래픽 증가 → VACUUM 지연
빠른 ID wraparound 위험	autovacuum이 주기를 놓치면 데이터베이스 전체가 정지될 수 있음

SELECT relname, last_vacuum, last_autovacuum
FROM pg_stat_user_tables
ORDER BY last_autovacuum DESC;

SELECT relname, n_dead_tup
FROM pg_stat_user_tables
ORDER BY n_dead_tup DESC;

SELECT * FROM pg_stat_activity WHERE query LIKE '%vacuum%';

autovacuum 설정 조정으로 민감 테이블 조절

autovacuum_vacuum_scale_factor = 0.1
autovacuum_vacuum_threshold = 50

TarzanDB는 DBMS 성능 저하 방지 및 안정적인 시스템 운영을 위한 실시간 Vacuum Monitoring 기능과 Vacuum 설정(Tuning) Guide를 제공합니다.

PostgreSQL은 Dead Tuple 관리 및 Table Reorganize 등을 위해 주기적인 관리 작업인 Vacuum 수행
Dead Tuple이 많은 경우, 빈번한 Vacuum이 발생되고, 이는 DBMS 성능 저하를 유발하여 PostgreSQL의 주요 이슈 사항
특히 데이터가 많은 Table에서 Lock이 발생하는 Vacuum Full은 서비스 장애 유발
TarzanDB는 빈번한 Vacuum, Vacuum Full 발생에 대한 체계적인 모니터링을 수행하고, 안정적인 운영 지원을 위한 개선 방안 제시