장애 대응 능력을 확인할 수 있는 지표

이언철·7일 전
0

DevOps

목록 보기
17/17
post-thumbnail

시스템 신뢰성 평가: MTTR, MTBF / 신뢰성 운영 평가: MTTA, MTTF

MTBF (Mean Time Between Failures): 평균 장애 간격

MTBF(평균 장애 간격)는 기술 제품에 발생하는 수리 가능한 장애 사이의 평균 시간입니다.

제품의 가용성과 안정성을 추적하는 데 사용되는 메트릭이며 장애 발생 사이의 시간이 길수록 시스템의 안정성이 높아집니다.

MTTR (Mean Time To Repair): 평균 수리 시간

MTTR(평균 수리 시간)은 고장난 시스템을 수리하여 정상 작동 상태로 복원하는 데 걸리는 평균 시간입니다.

수리 시간과 테스트 시간이 모두 포함됩니다. 이 메트릭은 시스템이 다시 완전히 작동할 때까지의 시간을 측정합니다.

MTTA (Mean Time To Acknowledge): 평균 확인 시간

MTTA(평균 확인 시간)는 알림이 트리거 된 시점부터 이슈에 대한 작업이 시작되는 시점까지의 평균 시간입니다.

팀의 대응성과 알림 시스템의 효율성을 추적하는 데 사용되는 지표입니다.

MTTF (Mean Time To Failure): 평균 장애 시간

MTTF(평균 장애 시간)는 기술 제품에 발생하는 수리 불가능한 장애 사이의 평균 시간입니다.

시스템의 가용 시간을 추정하는 데 사용되는 신뢰성 측정 지표입니다.

시스템의 신뢰성이 높을수록 MTTF도 길어집니다.

profile
Soomgo, DevOps

0개의 댓글

관련 채용 정보