BCP 절차

agnusdei·2025년 10월 29일

🇰 BCP (Business Continuity Planning, 업무 연속성 계획) 수행 절차

BCP(Business Continuity Planning, 업무 연속성 계획)는 예기치 않은 재해나 장애 발생 시에도 기업의 핵심 업무 기능을 사전에 정해진 목표 복구 시간(RTO, Recovery Time Objective) 및 목표 복구 시점(RPO, Recovery Point Objective) 내에 복구하고 지속적으로 운영하기 위해 수립하는 일련의 체계적인 절차와 계획입니다.

BCP 수립 및 수행 절차는 일반적으로 계획-분석-전략 수립-구현 및 개발-운영 및 유지보수의 5단계 또는 6단계 프레임워크를 따릅니다. 이는 국제 표준인 ISO 22301(사회 안전-업무연속성경영시스템)의 요구사항과도 밀접하게 관련됩니다.


1. 🚀 프로젝트 계획 (Project Initiation)

BCP 수립의 첫 단계로, 프로젝트의 범위, 목표, 조직 구성, 자원 확보 등을 정의하여 BCP의 성공적인 수행을 위한 기반을 마련합니다.

  • 목표 및 범위 설정: BCP의 목적(예: RTO/RPO 달성, 법규 준수 등)과 적용 범위(핵심 시스템, 조직, 사업장 등)를 명확히 정의합니다.
  • 경영진 승인 및 지원 확보: BCP의 성패는 경영진의 지속적인 관심과 지원에 달려 있으므로, 최고 경영진의 의지와 예산/인력 지원을 공식적으로 확보합니다.
  • BCP 조직 구성: 전담팀(Steering Committee, BCP Team, BCP Coordinator 등)을 구성하고 역할(책임과 권한) 및 비상 연락 체계를 확립합니다.
  • 표준 및 법규 검토: 관련 국내외 표준(ISO 22301 등) 및 규제(예: 전자금융거래법, 중대재해처벌법 등) 요구사항을 검토합니다.

2. 📊 업무 영향 분석 (BIA, Business Impact Analysis) 및 위험 평가 (Risk Assessment)

기업 운영에 필수적인 핵심 업무를 식별하고, 재해 발생 시 해당 업무 중단으로 인한 잠재적 영향(Impact)을 정량적/정성적으로 분석하여 복구 우선순위복구 목표를 결정하는 핵심 단계입니다.

  • 핵심 업무 식별 및 우선순위 결정: 기업의 가치 창출에 직접 기여하는 핵심 업무(Mission Critical Functions)를 파악하고, 중단 허용 시간(MAO, Maximum Allowable Outage)을 기준으로 우선순위를 설정합니다.
  • 복구 목표 설정:
    • RTO (Recovery Time Objective, 목표 복구 시간): 재해 발생 후 업무/시스템이 허용 가능한 최대 중단 시간 내에 복구되어야 하는 목표 시간입니다.
    • RPO (Recovery Point Objective, 목표 복구 시점): 재해 발생 시 허용 가능한 최대 데이터 손실량을 결정하는 지표로, 백업 주기를 결정하는 기준이 됩니다.
  • 자원/기술 의존성 분석: 핵심 업무 수행에 필요한 인력, 시설, IT 시스템, 데이터, 공급망 등 필수 자원 및 그 의존 관계를 분석합니다.
  • 위험 평가(Risk Assessment): 발생 가능성이 있는 재난/위협(자연재해, 기술적 장애, 인적 오류, 사이버 공격 등)을 식별하고, 해당 위험의 발생 가능성(Likelihood)영향도(Impact)를 분석하여 대응할 위험을 결정합니다.

3. 🛡️ 복구 전략 선정 및 설계 (Recovery Strategy Selection & Design)

BIA와 위험 평가 결과를 바탕으로, 수립된 RTO/RPO 목표를 달성하기 위한 가장 효과적이고 효율적인 복구 방안을 도출하고 설계합니다.

  • IT 복구 전략:
    • DR (Disaster Recovery, 재해 복구) 센터 유형 결정: RTO/RPO 목표 달성을 위해 Hot Site, Warm Site, Cold Site 또는 Mirror Site 등 IT 재해 복구 센터 구축 유형을 선정합니다.
    • 데이터 백업 및 복제 방안: 동기/비동기 복제, 백업 주기 및 저장 매체, 보관 장소 등을 결정합니다.
  • 업무 및 운영 복구 전략: 대체 시설 확보, 인력 운영 방안(비상 시 인력 이동, 재택 근무 등), 핵심 장비 조달, 공급망 관리 등 IT 외적인 업무 연속성 확보 방안을 마련합니다.
  • 비용-효과 분석: 여러 복구 전략 대안에 대해 구축/운영 비용과 RTO/RPO 달성 수준 등을 비교하여 최적의 전략을 선정합니다.

4. 📝 BCP 계획 개발 및 문서화 (BCP Plan Development & Documentation)

선정된 복구 전략을 구체적인 실행 절차로 문서화하고, 재해 발생 시 즉시 활용할 수 있는 운영 계획을 수립합니다.

  • 비상 운영 절차 개발: 재해 발생 전/중/후 단계별로 비상 상황 접수, 초기 대응, 비상 조직 가동, 피해 평가, 업무 복구 및 재개, 원상 복귀 절차 등을 상세히 정의합니다.
  • 비상 연락망 및 커뮤니케이션 계획: 재해 시 내부 이해관계자(임직원)와 외부 이해관계자(고객, 규제기관, 언론 등)에게 상황을 전파하고 소통할 명확한 절차와 연락처 목록을 구축합니다.
  • DRP (Disaster Recovery Plan, 재해 복구 계획) 작성: IT 시스템 및 인프라의 구체적인 복구 절차, 구성 정보, 담당자 역할 등을 상세히 기술합니다.
  • 문서화 및 배포: 모든 계획을 명확하고 가독성 높게 문서화하고, 관련 인원들에게 배포하며 교육합니다.

5. 🔁 교육, 모의훈련 및 유지보수 (Exercise, Maintenance, and Review)

BCP가 현장에서 효과적으로 작동하는지 검증하고, 변화하는 환경에 맞춰 최신 상태를 유지하는 가장 중요한 단계입니다.

  • 교육 및 인식 제고: 전 직원 및 BCP 관련 인력에게 BCP의 목적, 자신의 역할 및 절차에 대해 정기적으로 교육합니다.
  • 모의 훈련(Exercise) 및 테스트:
    • 훈련 유형: Walk-Through(절차 점검), Table-Top(토의), Simulation(모의), Full-Scale(실제 복구 테스트) 등 다양한 수준의 훈련을 주기적으로 실시합니다.
    • 목표: 수립된 RTO/RPO 달성 가능성, 계획의 실현 가능성, 조직 구성원의 숙련도 등을 검증합니다.
  • 결과 분석 및 개선: 훈련 결과를 분석하여 미비점과 문제점(Gaps)을 식별하고, BCP를 개정(Update)합니다.
  • 주기적 검토 및 감사: 조직 환경 변화, IT 시스템 변경, 핵심 업무 변경 등을 반영하여 BCP 문서를 정기적으로 검토 및 수정하고, 내부/외부 감사를 통해 적정성을 검증합니다.

BCP는 일회성 프로젝트가 아니라, 조직의 환경 변화에 맞추어 지속적으로 개선(Plan-Do-Check-Act)되어야 하는 경영 시스템(BCMS, Business Continuity Management System)의 관점에서 접근해야 합니다.

profile
DevSecOps, Pentest, Cloud(OpenStack), Develop, Data Engineering, AI-Agent

0개의 댓글