대규모 데이터 관리 - 데이터베이스 복제하기(리플리케이션)

여우·2023년 9월 25일

본인의 팬카페를 직접 개발해 운영하고 있는 김무뇽(1세).
사이드프로젝트로 만든 커뮤니티에 많은 사람들이 들어와 응원의 글을 남기자 무뇽이는 행복해해요.

그런데 어느날!
카카오톡에 '말랑쫀득 떡토끼 무뇽이의 여름' 신상 이모티콘이 출시되고,
이 이모티콘이 선풍적인 인기를 끌며
무뇽이의 팬카페에 유래없이 많은 사람들이 유입되기 시작했어요.

하지만 쪼꼬미 무뇽이처럼 쪼그만 서버와 데이터베이스로는
엄청나게 많은 사람들로 인한 트래픽을 감당하기에 너무나 버거웠고,

결국 무뇽이의 데이터베이스에 과부하가 걸려
고장나기에 이르렀어요.

데이터베이스를 뚝딱뚝딱 고쳐서 다시 가동하기까지 걸린 시간은 길어야 3시간 남짓.
하지만 그 3시간동안 팬카페를 전혀 이용하지 못한 무뇽의 팬들은 불만이 가득했어요.

짜증 한가득인 팬들에게 사과문을 쓰고 마음에 깊은 상처를 받은 무뇽이는
다음에 또 데이터베이스 과부하가 생기더라도
팬카페를 내리지 않고 계속 서비스할 수 있는 방법을 공부해 적용하기로 합니다.

데이터베이스를 하나 더 두자 - 스케일 아웃

무뇽이는 생각했어요.
하나뿐인 데이터베이스가 고장나면
이것을 완전히 고칠 때까지 팬카페를 정지할 수밖에 없구나.

만약 똑같은 데이터를 가지고 있는 예비용 데이터베이스 서버를 하나 더 둘 수 있다면,
원래 쓰던 하나가 고장나더라도
예비용 서버로 팬카페를 운영하고 그동안 고장난 쪽을 수리하면 되겠구나!

무뇽이는 무뇽팬카페의 단일 장애점, 즉 SPOF에 해당하는 데이터베이스의 문제점을 해결하기 위해
데이터베이스에 대한 스케일 아웃을 도입해보기로 결정했어요.

오! 말랑이가 어떻게 이런 생각을 해냈담.
무뇽은 자신이 천재가 아닌가 생각했어요.

실행력 강한 무뇽은 우선 데이터베이스 서버 2대를 추가로 구입해,
총 3대의 데이터베이스 서버를 가진 구조를 갖추었어요.

헉! 하지만 서버만 뚝딱뚝딱 늘리면 데이터 관리는 조상님이 해주나요,
서버의 물리적인 숫자가 늘어나자
무뇽은 이전까지 해본 적 없던 새로운 고민을 하게 되었습니다.

여러 개의 데이터베이스가 어떻게 데이터를 똑같이 가져? - 리플리케이션 개요

무뇽이 서버에 데이터베이스를 더 설치해서
데이터베이스가 총 세 개가 되긴 했는데,

실시간으로 데이터가 빠르게 생겼다 수정됐다 사라지는 상황에서
어떻게 다수의 데이터베이스 데이터를 똑같이 동기화, 즉 리플리케이션(Replication)해주느냐는 문제가 생겼습니다.

데이터베이스의 리플리케이션 방법을 사흘 밤낮으로 조사한 무뇽이는
자신의 서버에서 사용하고 있는 MySQL에서 리플리케이션 기능을 제공해주고 있다는 것을 알게 되었고
이 기능을 공부해보기로 하였어요!

MySQL의 리플리케이션

"MySQL 서버에서 일어나는 모든 변경 기록은 바이너리 로그(Binary Log) 라는 파일에 순서대로 기록된다.
그리고 이 바이너리 로그 안에 기록된 변경 기록 하나하나를 바이너리 로그 이벤트, 또는 간략하게 이벤트(Event)라고 한다."

이 문장을 읽자마자 눈을 반짝이는 무뇽이.
그렇다면 운영 중인 데이터베이스에서 기록한 모든 바이너리 로그를
예비용 데이터베이스로 가져와 똑같이 적용하면
간단하게 데이터 동기화를 해낼 수 있겠구나!

무뇽이는 MySQL의 데이터 복제 과정을 조금 더 자세히 들여다 보았어요.

바이너리 로그 -> 바이너리 로그 덤프 스레드 -> 리플리케이션 I/O 스레드 -> 릴레이 로그 -> 리플리케이션 SQL 스레드로 이어지는 긴 여정을 통해
두 데이터베이스가 빠르게 동기화할 수 있도록 MySQL에서 도와주고 있었어요.
(빨간색 단어들은 이 포스팅 내내 계속 반복해서 나오니 개념을 미리 이해해두면 좋아욥)

신기방기!

MySQL의 리플리케이션 기능을 이용해 이 3대의 서버 데이터를 동기화하기 위해서는
먼저 리플리케이션에서 아주 중요한 전략 하나를 정해야 했는데,
바로 소스 서버에 있는 바이너리 로그의 이벤트 하나하나를 리플리카 서버에서 어떤 방식으로 읽어올 것인가였습니다.

무뇽의 고민 1 - 바이너리 로그를 어떻게 식별할까

1. 바이너리 로그 이벤트의 이름과 위치를 통해 식별하자

바이너리 로그 파일 안에는 여러 개의 이벤트들이 순서대로 저장되어 있습니다.
'그럼 복제하려는 파일의 이름이랑, 복제해 올 이벤트의 위치만 정확하게 알 수 있다면
이걸 사용해 로그를 식별하면 되겠다!' 라고 무뇽은 생각했어요.

그 생각을 그대로 재현한
바이너리 로그 파일 위치 기반 리플리케이션을 적용해 두 데이터베이스의 동기화에 성공한 무뇽.
소스 서버에서 리플리카 서버로 데이터를 쇽쇽 복사해주는 것을 지켜보면서 뿌듯해하고 있습니다.

위 방법의 문제점

그런데 어느날, 또다른 무뇽 이모티콘 신상이 출시되면서
소스 서버가 또 터지고 말았어요!

무뇽은 하얗게 불타버린 기존의 소스 서버 대신
읽기 전용으로 사용하던 리플리카 서버를 새로운 소스 서버로 대체하고,
백업용으로 사용하던 리플리카 서버를 읽기 전용 서버로 대체하려고 했습니다.

하지만 백업용 리플리카 서버의 상태를 보고 크게 당황한 무뇽.
통계용 리플리카 서버에는 소스 서버로부터의 동기화가 50분 정도 늦게 진행되어,
소스 서버가 가지고 있던 원본 데이터와 50분만큼의 차이가 있는 상태였어요.

'으잉, 그래도 A 서버는 소스 서버와 같은 데이터를 가지고 있으니까,
A 서버의 바이너리 로그를 읽어서 데이터 동기화를 이어가면 되겠다!' 라는 똑똑한 생각을 하는 무뇽.
하지만 바이너리 로그 위치 기반 리플리케이션의 치명적인 단점으로 인해

무뇽의 계획은 무용지물이 되었고, 결과적으로
과부하로 마비된 데이터베이스 서버는 1대인데
실제로 쓸 수 없게 된 서버는 2대가 되는 참혹한 상황을 맞게 되었어요.

결국 2대가 분담해야 할 대량의 부하를 1대가 감당하게 되었고,
또다시 무뇽의 팬카페는 새하얀 오류 화면만을 보여주게 되었습니다.

어떤 문제가 있었던 걸까요?

결국 또다시 반성문을 쓰게 된 불쌍한 무뇽.
바이너리 로그 파일 위치 기반 복제의 문제점을 몸소 깨닫게 되었네요.

2. 바이너리 로그 이름을 통일해서 사용하자

'특정 서버에서만 식별할 수 있는 이름과 위치 정보는 다른 서버에서 이용할 수 없다.'

뼈아픈 깨달음을 얻은 무뇽이는
리플리카 서버에서 소스 서버의 이벤트를 읽어올 더 나은 방법을 생각해내야 했어요.

그러다 문득 떠오른 아이디어.
'소스 서버와 리플리카 서버에서 실행한 작업의 내용은 동일한데도
파일을 표현하는 방법이 달라서 인식하지 못했던 거잖아.
같은 작업을 수행한 이벤트는 어떤 서버에서든 같은 이름을 갖게 한다면
문제를 해결할 수 있지 않을까?'

놀랍게도, 5.5 버전 이후의 MySQL은 이 아이디어를 실현하여,
글로벌 트랜잭션 아이디(Global Transaction Identifier, GTID)를 이용한 복제 방식을 제공하고 있었습니다.

GTID 기반 복제의 효과

어느날 무뇽 어쩌구저쩌구 컬렉션이 또 출시되어
소스 데이터베이스 서버가 또 고장났어요!
GTID 기반 복제를 적용한 지금은 과연 장애 대처를 잘 해낼 수 있을까요?

와우!
바이너리 로그 파일 위치 기반 복제와 다르게
소스 서버의 GTID를 리플리카 서버에서도 이용할 수 있게 됨으로써
리플리카 서버 A로부터 리플리카 서버 B로의 데이터 동기화가 가능하게 되었어요.

만세를 부르는 무뇽!

요약

MySQL 리플리케이션의 복제 타입

바이너리 로그 파일 위치 기반 복제

글로벌 트랜잭션 아이디(GTID) 기반 복제

자료
Real MySQL 8.0 2권 434p ~ 445p

무뇽의 고민 2 - 이벤트에 어떤 내용을 기록해야 해?

GTID 기반의 안정적인 복제 방식을 도입한 후
잘 운영되는 무뇽팬카페를 보며 행복한 나날을 보내는 무뇽.

그런데 어느 날, 데이터베이스에 저장된 회원 데이터를 전체적으로 업데이트하는 작업을 하던 도중

데이터베이스의 소스 서버와 리플리카 서버 A, 리플리카 서버 B가
데이터베이스의 여유 공간이 부족하다는 경고를 차례대로 보내왔어요.

데이터를 수정만 했지, 한꺼번에 대량으로 추가하는 작업은 하지 않았기 때문에 매우 의아해하던 무뇽은
그 원인이 바이너리 로그에 있음을 알아차리고 깊은 고민에 빠졌어요.

변경된 데이터를 기록한다면 - Row 포맷

무뇽서버의 데이터베이스는 바이너리 로그의 각 이벤트들을 Row 포맷으로 기록하고 있었는데,
변경된 데이터를 그대로 바이너리 로그에 등록하는 특성상
굉장히 많은 데이터를 변경한 경우
그 대량의 데이터들이 전부 로그에 기록되면서 데이터베이스 공간에 과부하를 줄 수 있다는 문제가 있음을 알게 되었어요.

그렇다면 변경된 데이터를 그대로 바이너리 로그에 기록하는 대신
다른 방법을 쓸 수는 없을까.
차라리 실행한 SQL을 기록하는 게 낫지 않을까?

실행한 SQL을 기록한다면 - Statement 포맷

각 이벤트에서 실행한 SQL문을 바이너리 로그에 기록하는
Statement 기반 바이너리 로그 포맷을 도입한다면
바이너리 로그의 용량이 크게 줄어들기 때문에 더 이상 용량 걱정을 하지 않아도 될 거에요.

하지만 Statement 포맷을 선뜻 적용하기에는 찝찝함이 느껴집니다.

SQL문이 동일하다고 해도,
실행할 때마다 결과가 다르게 나타나는 몇몇 비확정적(Non-Deterministic) 쿼리들이 있다면
소스 서버와 리플리카 서버의 데이터가 다르게 기록되는 정합성 문제가 일어날 수 있기 때문이었는데요!

Statement 포맷을 사용하게 된다면
데이터베이스의 저장 공간을 취하는 대신 데이터 정합성이 깨진다는 딜레마에 빠지고 만 무뇽.

데이터를 동일하고 안전하게 복제하면서도 바이너리 로그의 크기를 적당하게 유지할 수 있는 좋은 방법은 없을 걸까요 🥹

두 방법의 장점만 취할 수 있다면 - Mixed 포맷

이런 고민을 MySQL 개발자들도 당연히 했을 것!

무뇽이 겪고있는 딜레마를 해소해주기 위해 MySQL에서는
평소에는 Statement 포맷으로 기록하다가,
만약 Statement 포맷으로 복제했을 때 문제가 될 가능성이 있는 쿼리인 경우에는
Row 포맷으로 변환하여 기록해주는 Mixed 포맷을 제공하고 있습니다.

Mixed 포맷을 적용함으로써
바이너리 로그의 용량과 데이터 정합성을 성공적으로 지켜낸 무뇽!

시행착오를 겪으면서 많은 공부와 성장을 해내고 있습니다.

요약

MySQL 리플리케이션의 복제 데이터 포맷

Statement 기반 바이너리 로그 포맷

Row 기반 바이너리 로그 포맷

Mixed 포맷

자료
Real MySQL 8.0 2권 469p ~ 485p

무뇽의 고민 3 - 복제하는 동안 데이터에 차이가 있지 않을까

데이터의 리플리케이션을 처음 경험하는 무뇽은 이런 고민을 하기도 했습니다.
'소스 서버에서 리플리카 서버로 데이터를 복제하는 데에도 시간이 걸리잖아.
복제하는 동안은 두 서버 사이의 데이터가 다를텐데, 문제가 되지는 않을까?'

비동기

이런 고민이 들 만도 한 것이,
무뇽팬카페의 데이터베이스 리플리케이션은 비동기 복제(Asynchronous replication)방식으로 동작하고 있었기 때문인데요!

이름에서 유추할 수 있듯, 소스 서버의 이벤트가 리플리카 서버들에게 잘 전송되었는지 확인하지 않기 때문에
서버들 간 데이터에 차이가 생길 가능성이 있습니다.

비동기 방식의 리플리케이션을 계속 하기에는 찜찜한 무뇽.
'동기 방식' 같은 더 안전한 동기화 방법은 없을까 찾아보던 중
웃긴 이름의 동기화 방식을 알게 되었습니다.

'반'동기

반동기(Semi-synchronous replication).
동기면 그냥 동기 하지 왜 반만 동기일까요?

비동기 복제 대신 반동기 복제를 선택하면
소스 서버와 리플리카 서버 사이의 동기화를 '어느 정도'는 보장할 수 있겠네요!

하지만 반동기 복제 또한
정확히 어느 시점에 이벤트를 리플리카 서버로 전송하고 응답을 받느냐에 따라
AFTER_SYNC, AFTER_COMMIT이라는 두 종류로 나눌 수 있었습니다.

흔치 않은 장애 상황에서만 일어날 수 있는 문제이지만,
팬텀 리드와 같은 데이터 정합성 문제가 일어날 여지가 있는 방식이 AFTER_COMMIT이군요 🤨

데이터의 정합성을 지키려면
AFTER_SYNC 방식의 반동기 복제를 적용하면 되겠다는 결론을 내린 무뇽.
반동기 복제 적용 방법이 MySQL 문서에 자세히 나와있으니 그대로 따라하기만 하면 되지만,
적용하기 전 마지막으로 진지하게 고민해보기로 합니다.
데이터베이스의 속도를 내리면서까지 꼭 정합성을 지켜야만 할까?

굳이?

'사용자가 소스 서버에 쓰기 작업을 하고, 리플리카 서버에서 그 데이터를 읽으려 하면 데이터가 없을 수도 있잖아!' 라고 생각한다면
데이터 정합성을 위해 반동기 방식을 쓰는 게 안전해 보이지만,
사실 데이터의 리플리케이션 작업은
우리의 생각보다 훨씬 짧은 시간안에 이루어진다고 해요.

200~300밀리초라는 어마어마하게 짧은 시간 안에
쓰기 -> 읽기 작업을 샥샥💨 해서
데이터 불일치로 생기는 불편을 느낄 일이 과연 얼마나 있을지 먼저 생각해보아야 합니다.

무뇽은 자신이 운영하는 무뇽팬카페의 성격을 되짚어보았을 때,
비동기 복제 방식을 계속 쓴다고 하더라도 큰 불편이 일어날 일이 없으며
오히려 반동제 복제를 사용했을 때 데이터베이스의 작업 처리 속도가 느려져서 불편해할 사람들이 더 많겠구나! 라는 결론을 내렸어요.

그렇게 비동기 복제 방식을 계속 사용하기로 마음먹은 무뇽은
더 새롭고 좋은 기술이 있다고 해도
무조건 적용하기 전에 그것이 본인에게 꼭 필요한 기술인지 고민하는 것이 중요하다는 깨달음을 얻었습니다. 😊

요약

MySQL 복제 동기화 방식

비동기

반동기

자료
Real MySQL 8.0 2권 484p ~ 493p

번외 - 리플리케이션 구조(토폴로지)

지금까지 리플리케이션을 설명하면서 예시로 들었던 무뇽팬카페 데이터베이스 설정은
소스 서버(쓰기용) + 리플리카 서버 1(읽기용) + 리플리카 서버 2(예비용) 이렇게 3대로 구성된 멀티 리플리카 복제 구성을 하고 있었습니다.

이런 멀티 리플리카 구성 외에도, 리플리케이션을 수행하는 목적에 따라 다양한 형태로 데이터베이스들을 두고 운영할 수 있어요.

일반적으로 사용되는 데이터베이스 구성 방식들을 간단히 알아본 후 포스트를 마무리하겠습니다. 🐋

싱글 리플리카 복제 구성

소스 서버 1 + 리플리카 서버 1로 구성된
가장 단순한 구성방식을 싱글 리플리카 복제 구성이라고 불러요!

멀티 리플리카 복제 구성

싱글 리플리카 복제 구성에서,
다른 용도의 데이터베이스가 더 필요해서 여분의 리플리카 서버를 더 두기 시작한다면
멀티 리플리카 복제 구성이 돼요.

무뇽의 데이터베이스도 백업 용도 외에 읽기 작업을 수행하는 데이터베이스가 필요하게 되면서
멀티 리플리카 복제를 사용하게 됐었죠!

체인 복제 구성

만약 소스 서버는 하나인데, 복제를 해주어야 하는 리플리카 서버가 엄청 많아진다면 어떻게 해야 할까요?
예를 들어, 대규모 서비스를 지탱하는 기술이라는 서적에서 예시로 든 하테나라는 기업은 데이터베이스 서버만 25대였다고 해요.

만약 이 기업의 리플리케이션 구성이 소스 서버 1대와 리플리카 서버 24대로 이루어졌다면,
소스 서버에서 리플리카 서버들로 이벤트를 전송하는 작업 자체가 부하로 작용할 수도 있을 거에요.

이때는 리플리카 서버가 또다시 다른 리플리카 서버에 대한 소스 서버 역할을 하는, 사슬같은 구조의 체인 복제 구성을 생각해볼 수 있습니다.

MySQL 서버를 전체적으로 업그레이드하거나, 장비를 일괄적으로 바꿀 때 복제 그룹 단위의 교체를 할 수 있는데요!
대략 아래와 같은 과정을 통해 교체가 이루어집니다.

듀얼 소스 복제 구성

지금까지 알아본 복제 구성은
데이터 쓰기용 서버는 하나만 사용하고,
읽기용 서버만을 확장한다는 전제를 바탕으로 한 구성이었어요.

하지만 쓰기 작업을 아주 많이 하는 서비스인 경우에는
쓰기용 서버를 여러 개 두어야 할 수도 있습니다!

ACTIVE-PASSIVE와 ACTIVE-ACTIVE

요약

MySQL 리플리케이션의 복제 토폴로지

싱글 리플리카 복제 구성

멀티 리플리카 복제 구성

체인 복제 구성

듀얼 소스 복제 구성

자료
Real MySQL 8.0 2권 494p ~ 503p

이렇게 무뇽팬카페의 시행착오를 따라가보면서
데이터베이스, 그 중에서도 MySQL의 리플리케이션 작업에 대해 알아보았습니다.

참고자료로 활용한 Real MySQL 8.0 2권에 훨씬 자세한 내용이 기록되어 있으니 참고하시길 바라요!

읽어주셔서 고마워요.
무뇽이도 이제 행복하게 살아야 한다! 🙌🏻🙌🏻🙌🏻

도움을 주신 분

여우

얼레벌레

이전 포스트

@Transactional 이모저모 1 - 테스트코드와 @Transactional

다음 포스트

구체적으로 성장하는 방법 1

18개의 댓글

한우석

2023년 9월 25일

엄청 길고 딱딱한 내용을 잘 풀어서 써주셨네요 굿

답글 달기

hongo

2023년 9월 25일

무뇽아~ 거기선 행복해라~

답글 달기

허브

2023년 9월 25일

무뇽이 깊게 고민한게 느껴집니다. 이해가 엄청 잘되네요

답글 달기

ahdjd 5

2023년 9월 26일

살면서 제일 재밌게 읽은 레플리케이션 관련 글이네요^^

답글 달기

이재윤

2023년 9월 27일

크 여우.. 양질의 글 진짜 잘 보고 갑니다 👍
DB 레플리카 내용이 원래 정말 어려운데 읽기 쉽게 잘 써주셔서 도움 많이 됐습니다.

답글 달기

dooboocookie

2023년 9월 28일

이 집 글 좋네요!!

답글 달기

SangHun Park

2023년 10월 1일

이해하기 쉽게 정리를 너무 잘해주신 것 같아요! 감사합니다!!!

답글 달기

JINN lee

2023년 10월 1일

엄청 납니다

답글 달기

vinca

2023년 10월 3일

편집툴을 뭘 쓰쎳을지 궁금할 정도로..아기자기 넘 귀엽네요.. XD

답글 달기

주노

2023년 10월 3일

여우의 글쓰기 재능 부럽네요 굿굿

답글 달기

Hann

2023년 10월 4일

많이 배우고 갑니다!

답글 달기

WWWWWWWWW

2023년 10월 4일

좋은 정보 감사합니다!!

답글 달기

jin

2023년 10월 5일

엄청난 정성이 느껴지는 글이네요 .. !
그림과 함께 보니 더욱 잘 읽히는 것 같아요. 감사합니다.

답글 달기

iamjooon2

2023년 10월 12일

여우도 복제해서 포스팅 작성 전용 여우를 만들어주심 안되나요?

답글 달기

Jae-Baek Song

2023년 11월 29일

와...

답글 달기

Sungmin kim

2024년 2월 3일

이해가 쏙쏙됩니다. 읽다가 잠시 미룬 RealMySQL을 덕분에 다시 읽어볼 수 있겠어요 ㅎ 좋은 글 감사합니다.

답글 달기

최민아

2024년 9월 19일

잘 읽었습니다~

답글 달기

str

2024년 10월 22일

정말 잘 쓴 글이네요. 존경합니다.

답글 달기