Amazon CloudWatch Alarms는 메트릭(Metric) 을 모니터링하고 특정 조건에 따라 알람을 트리거하는 데 사용 됩니다.
1. CloudWatch Alarms 주요 기능
1. 주요 목적
메트릭 기반 알림 트리거
- CPU 사용률, 네트워크 트래픽, 디스트 IO 등 AWS 리소스의 메트릭을 기준으로 알림 생성
- 예 : CPU 사용률이 80%를 초과하면 경고 발송
2. 상태(Alarm States)
알람의 상태는 세 가지로 구분됩니다.
OK
메트릭이 알람 조건을 충족하지 않는 정상 상태
INSUFFICIENT_DATA
메트릭 데이터가 부족하거나 알람 상태를 평가할 수 없는 경우
ALARM
메트릭이 정의된 조건을 충족하여 알람 상태로 전환
3. 평가 기간(Period)
- 알람 조건을 평가하기 위한 시간 단위(초) 를 설정.
- 기본값: 60초 단위.
- 고해상도 사용자 정의 메트릭:
- 10초, 30초 또는 60초 배수로 설정 가능.
- 짧은 평가 주기를 통해 더 빠르게 알림 생성 가능.
4. 다양한 옵션
- 평균(Average), 최댓값(Max), 최솟값(Min), 합계(Sum) 또는 퍼센트(%) 와 같은 다양한 통계 옵션으로 알람 조건을 설정 가능.
- 예: CPU 사용률의 평균값이 5분 동안 90%를 초과할 경우 알람 트리거.
5. 통합 가능성
CloudWatch Alarms는 다양한 AWS 서비스와 통합되어 알림 및 조치를 수행할 수 있습니다.
- Amazon SNS : 이메일, 문자 메시지, 또는 HTTP/S 알림 발송
- Auto Scaling : 조건에 따라 인스턴스를 자동으로 추가하거나 제거
- AWS Lambda : 알림 발생 시 사용자 지정 작업 수행
CloudWatch Alarms는 AWS 리소스 모니터링 및 운영 자동화를 위한 중요한 도구로, 이를 적절히 활용하면 시스템 안정성을 높이고 문제를 신속히 해결할 수 있습니다.
2. CloudWatch Alarm Targets
Amazon CloudWatch Alarms는 특정 조건이 충족되었을 때 다양한 작업(Targets)을 실행할 수 있도록 설정할 수 있습니다.

1. EC2 인스턴스 작업
CloudWatch Alarm은 EC2 인스턴스에 직접적인 작업을 트리거할 수 있습니다
- Stop: EC2 인스턴스를 중지.
- Terminate: EC2 인스턴스를 종료.
- Reboot: EC2 인스턴스를 재부팅.
- Recover: 장애가 발생한 EC2 인스턴스를 복구.
활용예시 :
EC2 인스턴스의 상태 확인 메트릭(StatusCheckFailed
)이 ALARM 상태로 전환되면 인스턴스를 복구하도록 설정
2. Auto Scaling 작업
CloudWatch Alarm Auto Scaling Group과 연동됭 다음 작업을 트리거할 수 있습니다.
- 인스턴스 추가(Scale Out)
- 인스턴스 제거(Scale In)
활용 예시:
CPU 사용률이 80% 이상으로 상승하면 Auto Scaling을 통해 새 인스턴스를 추가하여 부하를 분산.
3. SNS 알림 발송
CloudWatch Alarm은 Amazon SNS(Simple Notification Service) 로 알림을 전송
- 이메일, 문자 메시지(SMS), HTTP/HTTPS 요청 등을 통해 사용자 또는 시스템에 알림.
- SNS를 통해 다른 AWS 서비스(예: Lambda, S3, CloudFormation 등)와 통합 가능.
활용 예시:
디스크 사용량이 90%를 초과하면 SNS를 통해 이메일 알림을 보내고, AWS Lambda 함수를 호출하여 추가 스토리지를 자동으로 할당.
CloudWatch Alarm Targets를 활용하면 AWS 인프라를 더욱 자동화하고 효율적으로 운영할 수 있습니다. 알람 조건과 목표 작업을 잘 설계하여 시스템 안정성과 성능을 유지하는 것이 중요합니다.
3. CloudWatch Composite Alarms (복합 알람)
1. 기본 개념
CloudWatch Alarms는 개별 메트릭을 모니터링하여 알림을 생성하는 반면, Composite Alarms는 여러 개의 알람 상태를 결합하여 복합적인 조건을 만족하는 경우에만 알림을 발생시킵니다.
이를 통해 복잡한 로직을 처리하고, 더 정교한 알림을 설정할 수 있습니다.
2. AND / OR 조건
AND 조건
- 여러 알람이 모두 ALARM 상태일 때만 Composite Alarm이 트리거됩니다.
- 예: 두 개의 EC2 인스턴스가 모두 CPU Utilization이 80% 이상일 때만 알림을 보냄.
OR 조건
- 여러 알람 중 하나라도 ALARM 상태일 경우 Composite Alarm이 트리거됩니다.
- 예: 하나의 EC2 인스턴스가 CPU Utilization이 80% 이상이거나, 다른 인스턴스의 Disk Space가 90% 이상일 때 알림을 보냄.

4. EC2 인스턴스 복구 (EC2 Instance Recovery)
Status Check
- Instance Status: EC2 인스턴스 상태 확인.
- System Status: 하드웨어 상태 확인.
- Attached EBS Status: 연결된 EBS 볼륨 상태 확인.
CloudWatch Alarm
StatusCheckFailed_System
알람을 통해 EC2 인스턴스의 시스템 상태 체크 실패를 모니터링.
복구 시
Private IP, Public IP, Elastic IP, Metadata, Placement Group는 그대로 유지.
복구 조건: 하드웨어 문제로 인한 시스템 상태 실패 시 인스턴스 복구 가능.
