kkt data center burning sun 사건

강정우·2022년 10월 15일
0

자습

목록 보기
2/11


때는 22/10/15일 어느 해가찌던 어느 가을 날 sk c&c 의 data center가 불타고 말았다...
그리고 피해는 국민앱의 kkt이 가장 크게 손해를 봤다...
그리고 네이버의 미친 상황판단

무튼
평상시 자주 찾아보던 유튜브에서 이를 커뮤니티에 올렸고 댓글을 보다가 모르는 것들이 있어서 backend를 꿈꾸는 초보 개발자로서 공부하며 정리하기로 했다.

failover, switchover, Failback

⚖️ failover

  • 장애 극복 기능은 컴퓨터 서버, 시스템, 네트워크 등에서 이상이 생겼을 때 예비 시스템으로 자동전환되는 기능이다. 시스템 대체 작동 또는 장애 조치라고도 한다.

📜 example

평상시에 A 장비를 사용하다가, A 장비에 장애가 발생하면 준비했던 B 장비를 사용한다
운영되고 있는 시스템은 액티브(active), 같은 세팅으로 구성된 대기하는 시스템은 패시브(passive)라고 하는데 액티브에 문제가 패시브 시스템이 액티브 상대로 변경되면서 서비스를 이어서 운영하게 된다

⚖️ switchover

  • 사람이 수동으로 전환을 실시하는 것

⏲️ when?

  • 주로 고장의 원인이 외부에 있거나 내부에 있지만 처리가 안 된다면 수동을 실시하고 그 후 failover는 자동으로 처리하도록 함.

⚖️ failback

  • failover에 따라 전환된 서버/시스템/네트워크를 장애가 발생하기 전의 상태로 되돌리는 처리를 말한다.

📜 example

  • DBMS 장애로 대체 시스템이 동작하다가 장애가 복구(정상화되면) DBMS를 동작시키고 대체 시스템의 서비스는 대기 상태로 작동시키는 것 등이 있다

DRP, BCP

  • 재난 복구 계획 DRP(Disaster recovery planning)
  • 비즈니스 연속성 계획 BCP(Business Continuity Planning)
  • 경영자가 알아야할 영역이며 DR에 일환이라고 이해했다.

DR

  • Data Lake인줄 알았지만 생각해보니 DL임 ㅋㅋㅋ

⚖️ Disaster recovery

  • 재해 복구는 장비로 인한 장애나 사이버 공격과 같은 인재 또는 자연 재해가 발생한 이후 조직이 IT 인프라에 대한 액세스와 기능을 복구하는 방법이다.

⏲️ when?

  • 자연 재해, 장비 고장, 사이버 공격으로 인해 서버가 다운되면 비즈니스는 데이터가 백업된 두 번째 위치에서 손실된 데이터를 복구해야 한다. 가장 이상적인 경우는 조직이 컴퓨터 처리 작업을 원격 위치로 옮겨 운영을 계속하는 것이다.

📜 examples

  • 재해 복구의 유형

  • 백업: 가장 단순한 유형의 재해 복구로, 외부 또는 이동식 드라이브에 데이터를 저장하는 방식이다.
    하지만 IT 인프라 자체가 백업되는 것은 아니기 때문에 데이터를 백업하는 것만으로는 최소한의 비즈니스 연속성만 지원할 수 있다.

  • 콜드 사이트: 이 유형의 재해 복구에서는 자연 재해 또는 화재가 발생한 후, 거의 사용되지 않는 2차 시설에 기본적인 인프라를 구축하여 직원의 업무 공간을 마련한다. 이렇게 하면 비즈니스 운영을 지속할 수 있어서 비즈니스 연속성에 도움은 되지만, 중요한 데이터를 보호하거나 복구할 수는 없기 때문에 콜드 사이트와 다른 재해 복구 방식을 병행해야 한다.

  • 핫 사이트: 핫 사이트는 데이터 사본을 항상 최신 상태로 유지한다. 핫 사이트는 구축에 오랜 시간이 소요되고 콜드 사이트보다 높은 비용이 들지만 다운타임을 크게 줄일 수 있다.

  • 미러 사이트 : 미러사이트는 네트웍 트래픽을 줄이기 위하여 다른 컴퓨터 서버를 복사해 놓은 웹사이트 또는 컴퓨터 파일서버를 말하는데, 웹사이트나 파일의 가용성을 좋게 하고, 그 사이트에서 다운로드된 파일들이 미러사이트 부근에 있는 사용자들에게 보다 빨리 도착하게 한다.
    미러사이트는 원(原)사이트의 정확한 복제품이어야 하므로, 원사이트의 내용을 확실히 반영시키기 위해 보통 주기적으로 갱신된다. 미러사이트들은 원사이트가 지리적으로 어느 정도의 거리가 있을 때, 보다 빨리 액세스하기 위해 사용된다 (예를 들어, 많은 사용량이 있는 독일 내의 웹사이트라면, 미국 내에 미러사이트를 가지도록 조정할 수 있을 것이다).
    어떤 경우에는, 원사이트 (예를 들어 작은 대학의 서버)가 인터넷에 고속으로 접속되어 있지 않은 경우, 고속으로 접속되어 있는 대형 사이트에 미러사이트를 만든다면, 아마도 보다 많은 방문객을 유치할 수 있을 것이다.

  • Disaster Recovery as a Service(DRaaS): 재해 또는 랜섬웨어 공격이 발생하는 경우 DRaaS 공급업체는 조직의 컴퓨터 처리 작업을 자체 클라우드 인프라로 옮겨 조직의 서버가 다운되더라도 벤더의 위치에서 비즈니스 운영을 중단 없이 지속할 수 있다. DRaaS 계획은 구독 또는 종량제 모델로 이용 가능하다.
    로컬 DRaaS 공급업체를 선택하면 장단점이 있다. 조직 위치에 더 가까운 DRaaS 서버로 옮기면 지연 시간이 짧아지지만, 광범위한 자연 재해가 발생하는 경우 가까운 DRaaS가 해당 재해의 영향을 받을 수 있다.

  • Back Up as a Service: 원격 위치에 데이터를 백업하는 방식과 마찬가지로, Back Up as a Service에서는 외부 공급업체가 조직의 데이터를 백업하지만 IT 인프라를 백업하지는 않는다.

  • 데이터 센터 재해 복구: 데이터 센터의 물리적 요소를 통해 데이터를 보호하고 특정 유형의 재해 발생 시 더 신속한 재해 복구가 가능하다.
    예를 들어 화재 진압 툴은 데이터와 컴퓨터 장비를 화재로부터 보호하는 데 도움이 된다. 백업 전원은 정전 시 비즈니스가 운영을 중단하지 않고 지속할 수 있도록 해 준다. 하지만 이러한 물리적 자연 재해 복구 툴은 사이버 공격이 발생하는 경우에는 도움이 되지 않는다.
    따로 명시는 안 되어있지만 BCP의 geo replication 개념과 유사해 보인다.

  • 가상화: 조직은 물리적 재해의 영향을 받지 않는 외부 가상 머신에 특정 운영 및 데이터 또는 조직의 전체 컴퓨팅 환경을 복제하여 백업할 수 있다. 또한 재해 복구 계획의 일환으로 가상화를 활용하면 일부 재해 복구 프로세스를 자동화하여 모든 요소를 더 신속하게 복구할 수 있다.
    가상화를 효과적인 재해 복구 툴로 활용하려면, 데이터와 워크로드를 자주 옮겨야 하며 조직 내에서 몇 대의 가상 머신이 운영되고 있는지 IT 팀과 원활히 소통해야 한다.

  • 특정 시점 사본: 특정 시점 "스냅샷"이라고도 하는 특정 시점 사본은 특정 시점의 전체 데이터베이스에 대한 사본을 만든다. 이러한 백업을 통해 데이터를 복원할 수 있지만, 이는 해당 사본이 재해의 영향을 받지 않는 외부 또는 가상 머신에 저장된 경우에만 그러하다.

  • 즉각적인 복구: 즉각적인 복구는 특정 시점 사본과 유사하나, 데이터베이스를 복사하는 대신 전체 가상 머신의 스냅샷을 생성한다.

IDC

⚖️ Data Center

인터넷과 연결된 데이터를 모아두는 시설. 통신 기기인 라우터와 수많은 서버, 그리고 안정적 전원 공급을 위한 UPS 등으로 구성된다. 보통 IDC(Internet Data Center)라고 부르며, 클라우드 컴퓨팅을 위한 데이터 센터는 CDC(Cloud Data Center)라고 하는데 이 역시 일반적으로는 IDC나 Data Center라고 지칭한다. 기술 발전으로 일반적인 데이터 센터들도 이제는 클라우드 컴퓨팅 기능을 모두 포함하고 있기 때문이다.
라우터인터넷을 구축하는데 가장 중요하다면, 서버인터넷 서비스를 만들어 내는 데 가장 중요하다. 서버를 안정적으로 운용하며, 인터넷과의 연결을 고속화하고 지리적으로 중앙집중화 시킬 필요가 있을 때 설립된다. 한정된 공간에 많이 몰아놔야 이득이기 때문에 서버는 대개 랙마운트 형을 쓴다.

PDU

⚖️ 프로토콜 데이터 단위(Protocol Data Unit)

  • 동일 통신계층(즉, Peer-to-Peer) 간에 운반(교환)되는 전체 데이터량 (실제데이터 + 운반수단) 이다.
  • 이 부분은 추후 네트워크 공부를 하면 추가로 포스팅 하겠다.

profile
智(지)! 德(덕)! 體(체)!

1개의 댓글

comment-user-thumbnail
2022년 10월 17일

깨깨오톡이 안되서 이해가 안됬는데 이것덕분에 조금 알수있게됬어요

답글 달기