SPOF(Single Point of Failure, 단일 장애 지점)란 시스템 내에서 하나의 구성 요소가 고장났을 때 전체 시스템이 중단되는 지점을 말합니다.
즉, 해당 구성 요소가 고가용성(HA)을 갖추지 못한 경우 장애 발생 시 서비스 전체에 치명적인 영향을 줄 수 있습니다.
단일 서버
웹 서버가 한 대뿐이라면, 이 서버가 다운되면 전체 서비스가 중단됩니다.
단일 데이터베이스
DB가 하나라면 장애 발생 시 데이터 접근이 불가능합니다.
단일 스위치 / 라우터
네트워크 장비 하나에만 의존하면, 그 장비가 장애 시 전체 네트워크가 마비됩니다
| 영역 | 대책 방법 |
|---|---|
| 서버 | 로드 밸런싱, 서버 이중화 (Active-Active / Active-Passive) |
| DB | 마스터-슬레이브 복제, 클러스터링 |
| 네트워크 | 이중화된 라우터/스위치, 이중 NIC 구성 |
| 스토리지 | RAID 구성, 이중 SAN 구성 |
| 인증 시스템 | OAuth 또는 SSO 서버 이중화 |
서비스 구성 요소 중 하나라도 멈췄을 때 전체 서비스가 영향을 받는가?
이중화 구성 없이 단일 시스템에 의존하고 있는가?
장애 발생 시 자동 복구 메커니즘이 존재하는가?
모니터링 및 알림 체계가 제대로 구성되어 있는가?
SPOF(Single Point of Failure)는 하나의 구성 요소 장애로 전체 시스템이 멈추는 단일 실패 지점을 의미하며, 고가용성을 위해 반드시 제거해야 합니다.