Datadog APM 사용 관련 팁 정리

이애옹·2025년 3월 12일
0

Datadog 적용하기

목록 보기
3/3
post-thumbnail

이미지 출처 : https://1000logos.net/datadog-logo/

Datadog APM 서비스 관련하여 교육 들은 내용이 있어서 정리!

📝 Troubleshooting Patterns

📝 ECS Explorer

  • Amazon ECS 환경의 종합 모니터링을 위한 페이지로 Fargate 메모리 부족 등을 해당 페이지에서 확인 가능

  • ECS Explorer 참고자료 : Amazon Elastic Container (ECS) Explorer

📝 APM 로그 확인 팁

✏️ 첫번째, APM 로그 확인 방법 팁

  • APM을 Endpoints 기준으로 확인한 뒤, LATENCY 내림차순을 확인하는것을 추천

  • 시간이 너무 오래 걸린 서비스에 대한 로그를 자세하게 확인 가능

✏️ 두번째, 버전별 로그 확인 방법

  • Deployments를 확인할때는 버전에 따라 로그를 확인하는것이 좋은데,
    앱을 올릴때 버전을 Container ID 등으로 서로 다르게 고정해두면 Version별 에러를 쉽게 확인 가능

✏️ 세번째, APM 로그 커스텀 매트릭으로 보관

  • APM 로그를 사용자 커스텀 매트릭으로 보관해두면 15개월간 확인 가능

  • 커스텀 매트릭 참고자료 : APM 메트릭

✏️ 네번째, Instrumentation 활성 추천

  • 기존 APM은 소스코드를 변경해야 로그와 트레이스 데이터 확인이 가능하나, 해당 기능은 코드 변경 없이 실시간으로 오류 발생 추적 가능

  • 오류 발생 시점을 자동 캡쳐하여 함수의 파라미터 및 변수값등이 자동으로 저장됨

  • if문, for문, try-except 블록과 같은 특정 코드 부분이 어떤 값으로 실행되었는지 실시간으로 확인 가능

  • 단, node.js 포함 몇몇 서비스는 preview 단계

  • Instrumentation 관련자료 : 동적 계측

✏️ 다섯번째, Recommendations 활성 추천

  • APM -> Database Monitoring -> Recommendations 사용 추천

  • 데이터베이스 성능 최적화 및 잠재적 문제 사전 식별 가능

  • 인덱스 누락 및 사용되지 않는 인덱스, 디스크 공간 부족, 장시간 실행 쿼리등에 대한 분석을 제공

  • Recommendations 관련자료 : Recommendations

✏️ 여섯번째, ASM을 이용한 APM 보안 활성화

  • Application Security Management (ASM)을 이용한 APM 보안 활성화

  • 요청 위조나 SQL Injection, XSS 등과 같은 코드 수준 취약성을 이용하려는 공격에 대한 보호 기능 제공

  • 서버, Docker, k8s, ECS, Fargate에서 직접 호스팅되는 앱을 모니터링 하고 보호하기 위한 조치

  • 위협이 탐지되면 보안 신호가 Datadog에서 생성되며, HIGH 또는 CRITICAL 심각도 보안 신호의 경우 알림은 Slack, 이메일, PagerDuty를 통해 팀에 알리고 위협에 대한 실시간 컨텍스트를 제공

  • 아래와 같이, 보안 위협을 가한 특정 IP의 요청단계등을 시각화하여 확인 가능

✏️ 일곱번째, status Error 체크 추천

  • 에러를 보다 손쉽게 확인하는 방법으로 APM -> Traces -> status Error 체크를 추천

  • 전체 에러를 Timeseries등 다양한 차트로 확인 가능하며, Top List등으로 확인 시 자주 발생하는 에러 순으로 확인 가능

  • 아래와 같이, HTTP → Status Code로 확인 시 발생한 에러가 500대 에러인지, 400대 에러인지등을 선택하여 확인하는 방식도 추천 (현재는 에러가 없어서 No matching)

profile
안녕하세요

0개의 댓글