중앙집중식 모니터링

.·2026년 2월 24일

1. 개요

1.1 문서 목적

여러 인스턴스로 되어있는 우리 서비스의 트래픽과 각종 지표들을 하나의 모니터링 서버에서 관측해보자

1.2 목차

1) 개요
2) 각 서비스별 매트릭 수집
3) 남은 서비스 매트릭 발산 로직 추가
4)

2. 각 서비스별 매트릭 수집

2.1 현재 상황

현재 프론트와 백엔드는 매트릭을 수집중이고 AI는 진행되고 있지 않다. DB는 로컬에서 매트릭을 수집하였지만 AWS RDS로 변경되어 매트릭을 수집을 추가해야한다.

2.2 해야할 것

현재 RDS와 AI의 매트릭을 수집해야한다.

3. 남은 서비스 매트릭 expose 로직 추가

3.1 현재 남은 서비스

현재 AI와 RDS 매트릭 발산 로직을 추가해야한다.

3.2 AI

AI 서버 성능 지표 측정을 위한 메트릭 expose 구현

3.3 RDS

4. 프로메테우스

로컬에서 아래 명령어 치고 localhost:9090 으로 접속

aws ssm start-session \
  --target i-0fc15744c6ed54094 \
  --document-name AWS-StartPortForwardingSession \
  --parameters '{"portNumber":["9090"],"localPortNumber":["9090"]}' \
  --region ap-northeast-2

5. 그라파나

로컬에서 아래 명령어 치고 localhost:3000 으로 접속

aws ssm start-session \
  --target i-0fc15744c6ed54094 \
  --document-name AWS-StartPortForwardingSession \
  --parameters '{"portNumber":["3000"],"localPortNumber":["3000"]}' \
  --region ap-northeast-2   

5.1 문제 1

현재 126, 49가 ai prod 인스턴스들인데,

ai prod 1 : 10.0.4.126
ai prod 2 : 10.0.3.49

인데, 10.0.4.126 밖이 그라파나에 안나오고

profile
하면 된다

0개의 댓글