개요
기존 AWS RDS postgresql에서 TOBE AWS Aurora postgresql로 DB 이관 작업을 진행
- 마이그레이션 뿐 아니라 다른 계정의 AWS와 VPC환경으로 이관해야했음 (조직 및 관리의 이슈로 계정 분리가 필요했음)
- 안정성과 정합성을 확보하기 위해 중단 후 배포하는 것으로 진행
- 스냅샷을 이용하여 복원하는 방식으로 진행
- 파일 덤프 떠서 이관하거나 DB 개발 툴을 이용하는 방법도 있지만, 시간이 오래 걸리고 안정성도 떨어지기 때문에 스냅샷을 이용하기로 결정함
- 다른 계정으로 DB를 복원할때는 AWS에서 지원하는 DB 암호화 방식인 KMS를 설정해야한다. -> KMS로 복호화 및 암호화가 두 차례 필요함
할 일
- 나의 역할은 작업을 리딩하는 역할
- 유관시스템 담당자들과 소통하기 및 R&R 정하기
- 영향도 파악하기
- DB 이관 작업 대시보드 만들기
- 작업에 대한 설명
- 담당자
- 비상 연락망, 출근여부, 출석 체크 항목이 있어야한다.
- 체크리스트 작성
- 일자별 체크리스트를 만들고 체크가 다 되어야 작업을 진행한다.
- 스케줄 시트 작성하기
- 스케줄 시트에는 시간, 작업내용(+가능하다면 작업에 필요한 커맨드, 완료 여부 판단 기준까지), 담당자, 완료여부 컬럼이 있어야함
- 작업 완료 기준이 있어야한다.
- 모두의 마음이 맞춘 상태로 진행해야한다(소통의 중요성)
- 사전 작업 공유에 신경써서 무리한 진행을 피하고 리스크를 줄여야 한다.
- 담당자 별 체크리스트, 타임 스케줄 공유를 진행한다.
- 진행 상황은 전체 메일, 문서 등으로 공유한다.
- 작업 리딩하기
- 작업자와 리더의 역할은 분리되어야한다.
- 리더는 스케줄 테스크 별로 통제 및 다음 단계 진행한다.
- 작업 전 스케줄을 공유하고
- 작업 당일 시작 시 스케줄을 리뷰하는 시간을 갖고
- 완료 시 완료 사실을 전파한다.
- 완료 후에는 모니터링과 오류 리포트가 필수

놓친 것
- 사전 작업은 다 완료 했으나 스케줄 시트를 완벽하게 작업하지 못한 것 (thx to 데브옵스님..)
- 사전 작업은 영향도 분석, 유관 시스템 담당자 조사 및 작업 일정 조율, 사전 DB dummy data삭제 등은 완료했으나 이 내용들의 정리를 잘 못했음
- 영향도 분석으로는
- 인터페이스 목록 조사
- 업무 조사
- 방화벽 조사 등이 있다.
- DB 마이그레이션 이후 쌓일 데이터 파악 못한 것 ⇒ 서버 재가동 후 밀려있던 데이터들이 한꺼번에 쌓이면서 서버 메모리 & 병목현상 & 타임아웃 오류 발생 가능
- 혼자 너무 많은 일을 맡고 있어서 담당자들의 공감을 얻지 못하고 작업을 진행했음