Amazon CloudWatch 는
AWS 리소스(EC2, RDS, Lambda 등)와 애플리케이션을 모니터링 및 로깅할 수 있는 서비스입니다.
CPU, 메모리, 네트워크, 디스크 사용량 등 지표 수집
애플리케이션 로그, 시스템 로그를 중앙에서 관리
특정 조건 발생 시 알림 (예: CPU > 80% → Slack/Email로 알람)
지표와 로그를 시각적으로 모니터링
AWS 리소스에서 발생하는 이벤트를 감지하고 자동으로 대응 (예: Auto Scaling 트리거)
EC2 CPU 사용률이 80% 초과 시 알람 전송
RDS 스토리지가 가득 차기 전 경고 발생
Lambda 함수 오류율이 일정 기준 이상일 때 Slack/이메일 알림
S3 버킷 접근 로그를 중앙 집중형 분석
Auto Scaling과 연동 → 트래픽 급증 시 서버 자동 확장
현업에서는 CloudWatch를 다음과 같이 적극적으로 활용합니다.
서버 상태, DB 성능, API 응답 시간 등을 실시간 모니터링
CloudWatch Alarms + SNS → 장애 발생 시 Slack, Teams, PagerDuty로 알림 전송
CloudWatch Events → 특정 조건 충족 시 Lambda 실행
예) CPU 90% 이상 → Auto Scaling Group에 새 EC2 추가
사용량/비용 관련 메트릭 추적 → AWS Budgets와 함께 활용
CI/CD 파이프라인 로그 수집
보안 모니터링(AWS GuardDuty, Config와 함께)
AWS CloudWatch는
모니터링 (Metrics & Logs), 알림 (Alarms & SNS), 자동화 (Events & Lambda 연동)
등을 통해 운영 안정성과 가용성을 높여주는 핵심 서비스입니다.