https://community.grafana.com/t/thanos-vs-mimir-choosing-the-right-prometheus-extension/157751
Prometheus는 훌륭한 메트릭 수집 도구이지만,
엔터프라이즈 환경에서 요구되는 고가용성, 장기 데이터 보존, 재해 복구, 멀티 클러스터 Observability를
단독으로 충족시키기에는 한계가 있습니다.
이러한 한계를 보완하기 위해 Thanos, Cortex, Mimir, VictoriaMetrics와 같은
다양한 Prometheus 확장 프로젝트들이 등장했습니다.
그중에서도 Thanos와 Mimir는 가장 널리 채택되고, 가장 많이 비교되는 솔루션입니다.
이 글에서는 두 솔루션을 중심으로 차이점을 살펴봅니다.
| 항목 | Prometheus Federation | Thanos | Grafana Mimir | VictoriaMetrics | Cortex |
|---|---|---|---|---|---|
| 고가용성 | 미지원 | 지원 | 지원 | 지원 | 지원 |
| 원격 스토리지 | 미지원 | 지원 | 지원 | 미지원 | 미지원 |
| 통합 뷰 | 지원 | 지원 | 지원 | 지원 | 지원 |
| 문서화 | 제한적 | 양호 | 제한적 | 매우 우수 | 매우 우수 |
| 성숙도 | 성숙 | 성숙 | 초기 단계 | 성숙 | 성숙 |
Thanos는 Prometheus를 Sidecar 모델로 확장합니다.
구성 요소:
장점:
Mimir는 극단적인 확장성을 목표로 설계되었으며,
LGTM 스택에서 메트릭 계층의 핵심 역할을 수행합니다.
주요 특징:
핵심 강점은 대규모 환경에서도 일관된 쿼리 성능입니다.
Mimir
6시간 쿼리: 80–100ms

7일 쿼리: 80–100ms

Thanos
6시간 쿼리: 200–250ms

7일 쿼리: 2000–4000ms

Mimir는 일주일 단위의 장기 쿼리에서도 낮은 레이턴시를 유지한 반면,
Thanos는 조회 기간이 길어질수록 성능 저하가 두드러졌습니다.
| 항목 | Mimir | Thanos |
|---|---|---|
| 설계 철학 | 확장성과 성능 중심 | 단순성과 비용 효율 |
| 아키텍처 | Remote Write 기반 수집 | Sidecar 모델 |
| 주요 리스크 | Ingester 메모리 압박 | Compaction 실패 |
| 생태계 | Grafana Labs 주도 | CNCF 커뮤니티 |
| 쿼리 성능 | 일관되게 낮음 | 장기 쿼리 시 높음 |