Amazon CloudWatch

realBro·2023년 7월 21일
  • 해당 글은 유튜브 AWS 강의실을 보고 정리한 내용입니다

Amazon CloudWatch

  • AWS에서 제공하는 AWS 서비스 / 어플리케이션(외부도 가능)의 모니터링 서비스
  • Public 서비스
    • 인터넷을 통해 접근 or Interfcae Endpoint로 접근
  • 사용 중인 모든 AWS 서비스에 대한 지표가 자동으로 표시
  • 로그, 지표, 이벤트 등의 운영데이터를 수집하여 시각화 및 처리
    • 경보 생성을 통해 자동화 된 대응 가능
  • 지표 레포지토리

지표(Metric) 수집

  • 시간 순서별 데이터 요소의 집합, 다수의 데이터 포인트로 구성
  • AWS 서비스 / 어플리케이션의 퍼포먼스를 모니터링 하기 위해 지표 생성
  • 커스텀 지표 생성 가능, 유저가 직접 원하는 데이터 포인트를 생성, CloudWatch로 전달하여 생성
  • 리전 단위
  • 최대 보관 기간 15개월

지표의 구성

네임스페이스

  • CloudWatch 지표의 컨테이너
  • 지표의 출신 혹은 성격에 따라 논리적으로 묶은 단위
  • AWS 에서 수집하는 기본적인 지표는 AWS/{서비스명} 형식
  • 필수 항목, 반드시 직접 명시 해야함

지표 이름

  • 지표의 고유 이름, 필수

데이터 포인트

  • 지표를 구성하는 시간-값 데이터 단위
  • UTC 기준 권장, 내부적인 통계 혹은 알람 등에서 UTC기준으로 활용
  • Resolution : 데이터가 얼마나 자주 수집되는지(기본값 : 60초)
  • Period : 얼마 만큼의 시간을 기준으로 묶여서 보여지는지에 관한 개념
    • 1,5,10,30 혹은 60의 배수 단위로 최대 1일까지 가능
    • 60초 미만은 최대 3시간 보관, 60초는 15일, 300초는 63일, 1시간 15개월
    • 데이터가 사라지는 것이 아닌 큰단위로 계속해서 합쳐짐
    • 2주 이상 데이터가 업데이트 되지 않은 Metric의 경우 콘솔에서 보이지 않음
      • 모든 콘솔에서 사라지고 CLI에서만 확인 가능!
  • 차원(Dimension)
    • 일종의 태그/카테고리, 키-밸류로 구성되며 Metric을 구분할 때 사용
    • 최대 30개 까지 할당 가능
  • Unit : 단위(%,byte,...)

경보(Alarm)

  • 수집된 지표 값에 따라 알림 생성 가능
    • 일정 수치로 도달하거나 이상/이하 일때 이벤트 발생
  • 다양한 방법으로 대응 가능
    • SNS로 Lambda 실행, 이메일 전달 등등
  • 3가지 상태
    • OK : 정상 상태
    • Alarm : 알람 상태
    • INSUFFICIENT_DATA : 알람 상태를 확인하기 위한 정보가 부족함
  • Resolution에 따라 경보의 평가 주기 변동
  • ex) 404 에러가 5번 이상 일어났을때 SNS로 후행 작업 가능

로그 수집 및 관리

  • 여러 AWS 서비스의 로그 수집
  • 수집된 로그를 Kinesis, S3 등 다른 서비스/계정으로 전달 가능
  • 혹은 자체적으로 확인하거나 쿼리 가능

대시보드

  • 수집한 로그/지표를 기반으로 대시보드 구성
  • 외부 리소스를 활용해서 커스텀 대시보드 구성 가능
    ex) s3 객체 표시, HTML 커스텀 그래프 표시

기타 서비스

  • 애플리케이션을 모니터링 하는 Synthetics Canary
  • 애플리케이션, 컨테이너, Lambda등의 문제를 찾아주는 인사이트 서비스

System Manager의 파라미터 스토어에서 트래킹 할 파라미터를 생성해서 사용

  • 컨피그를 통해 ec2의 로그 위치, 그 수집을 위한 정보들 설정

출처

1개의 댓글

comment-user-thumbnail
2023년 7월 21일

잘 봤습니다. 좋은 글 감사합니다.

답글 달기