[TIL] 에러노트 23.04.21 EC2 상태검사 1/2개 통과

hyewon jeong·2023년 4월 21일
1

TIL

목록 보기
120/138

발생

EC2 인스턴스에서 실행 중이던 앱에 접속이 안되어 인스턴스 상태 확인을 해보니 상태검사 1/2개 통과 라는 메시지를 발견했다.

위 두 가지중 어떤것이 문제인지 파악하기 위해서는 'ec2 콘솔 -> 인스턴스 -> 상태 검사' 탭을 참조하면 알 수 있다.

아래는 문제가 생긴 내 인스턴스의 상태 검사 탭인데 나의 경우

시스템 상태 검사 : 통과, 인스턴스 상태 검사: 인스턴스 연결성 검사 실패 였다.

원인 분석

인스턴스 상태 검사를 통과 하지 못한 경우 원인 분석을 위해 시스템 로그를 확인하고 시스템 로그에 있는 데이터에 따라 그에 맞는 해결 방법을 적용해야 한다.

  1. 인스턴스 리부트: ec2 console -> 인스턴스 ->인스턴스 상태 -> 인스턴스 재시작

  2. 시스템 로그 확인: 재시작 후 인스턴스 상태가 '실행중' 이면 -> 작업 -> 모니터링 및 문제해결 -> 시스템 로그 가져오기

분석 결과

aws 에서는 친절하게도 위 로그에서 발견 할수 있는 대표적인 error 들을 정리해 분석시 참조 할 수 있게 제공한다.
링크 : Troubleshoot system log errors for Linux-based instances
하지만 도무지 알 수 없어 아래에 사진처럼

부팅 또는 네트워크문제일 경우 EC2 직렬콘솔을 사용하여 문제를 해결합니다.
[연결] 버튼을 선택하여 세션을 시작합니다.

라는 문구를 보고 연결을 했더니 상태검사를 통과하였다.

상태검사

Amazon ec2는 아래 두 가지 상태 확인을 통해 각 ec2 인스턴스 상태를 모니터링한다.

  1. 시스템 상태 확인

시스템 상태 확인은 인스턴스가 실행되는 기본 호스트에서의 문제를 탐지합니다. 네트워크, 하드웨어 또는 소프트웨어 문제로 인해 기본 호스트가 응답하지 않거나 이에 연결할 수 없는 경우 이 상태 확인에 실패합니다.

  1. 인스턴스 상태 확인

인스턴스 상태 확인 실패는 인스턴스의 연결 가능성에 문제가 있음을 나타냅니다. 이 문제는 다음과 같은 운영 체제 수준 오류로 인해 발생합니다.
1. 운영 체제 부팅 실패
2. 올바른 볼륨 탑재 실패
3. CPU 및 메모리 소진
4. 커널 패닉
5. 네트워크가 작동하지 않음

profile
개발자꿈나무

0개의 댓글