CAT API
- Compact and Aligned Text API
가장 많이 사용되는 API 4개
- _cat/health
- 클러스터의 전반적인 상태확인 API
- 상태 종류
- green : 프라이머리, 레플리캬 사드 모두 정상적으로 배치
- yellow : 프라이머리 정상, 레플리카 비정상 -> 검색 성능 악영향
- red : 프라이머리와 레플리카 둘 다 비정상
- _cat/nodes
- 기본적인 노드 정보 확인 API
- h 옵션을 통해 header 지정 -> 원하는 정보 filtering
- _cat/indices
- 인덱스 상태 확인 API
- 인덱스 프라이머리 샤드 & 레플리카 샤드 갯수 확인
- 이상 상태 인덱스 확인
- _cat/shards
?v 하면 사람이 볼 수 있는 형태(verbose)
Elastic Search 주요 지표
모니터링 도구 선정
- AWS OpenSearch : AWS CloudWatch
- ElasticSearch : Kibana..
그 외 promtheus도 고려할 만 함
어떤 지표를 모니터링 할 것인가
- 알람을 받아서 처리해야 할 지표
- CPU Usage : 노드가 CPU를 얼마나 많이 사용하고 있는가 - 50% 이상
- Disk Usage : 노드가 얼마나 많은 문서를 저장하고 있는가 - 70% 이상
- Load : 노드가 얼마나 많은 CPU 및 Disk 연산을 처리하는가 (부하) - cpu 갯수 따라서
- JVM Heap : JVM 메모리 사용량 - 꺾이는 등 정상적인 GC 상태를 관측 - 85% 이상
- Threads : 처리량을 넘어가는 색인 / 검색 요청 존재 여부 - Rejected Threads 발생시
- 문제 원인 분석에 사용되는 지표
- Memory Usage : 노드에 설치되어 있는 물리적 메모리 사용량 (JVM Heap과 별개)
- GC Duration : gc 소요시간
- GC Rate : Old/Young GC의 발생 주기 파악
- Disk I/O : 노드에 발생하는 디스킈 연산의 지연 시간
- Latency : 검색과 색인 요청에 소요되는 시간
- Rate : 검색과 색인 요청이 인입되는 양