데이터베이스 다중화

이신필·2021년 12월 23일

데이터베이스

목록 보기

1/2

MySQL에서 모든 변경 사항을 순서대로 저장하고 있음 다음 명령어로 볼 수 있다.

show binary logs
show mater status;

소스 서버의 바이너리 로그가 레플리카 서버로 저장되고 그것을 통해 데이터의 동기화가 진행됨

Statement 방식: SQL문을 바이너리 로그에 그대로 기록함
- 트랜잭션 격리 수준이 REPEATABLE-READ 이상이어야 데이터가 일치함
- 비 확정적으로 실행되는 쿼리(order by limit delete같은 매번 다르게 평가되는)가 있으면 데이터가 달라질 수 도 있음
Row 방식: 변경된 데이터 자체를 기록하는 Row 방식
- 가장 일관적인 데이터 저장 방식 → 안전함
- 단시간에 로그파일이 커짐
Mixed: statement와 row방식을 혼합함
- statement로 기록했을때 안전하지 않을것같으면 row방식으로 기록함

이러한 복제 과정은 3개의 스레드를 통해 복제되는데

소스서버의 Binary Log Dump Thread가 바이너리 로그를 레플리카서버에 전송함
레플리카서버의 Replication I/O Thread 바이너리 로그 이벤트를 레플리카 서버에 Relay Log파일로 저장

(연결시 사용정보는connection metadata에 있고, slave_master_info에 저장됨)
레플리카서버의 Replication SQL Thread는 Replication I/O Thread에 의해 작성된 Relay Log파일을 읽고 실행함

(릴레이 로그 이벤트를 서버에 적용하는 컴포넌트를 applier라고 하는데 이벤트가 저장된 릴레이로그 파일명,위치와 소스서버에 연결할 때 사용하는 정보가 저장되어있다. slave_relay_log_info테이블에 저장됨)

바이너리 로그 파일 위치 기반
- 레플리카 서버에서 소스 서버의 바이너리 로그 파일명과 파일내에서 위치로 바이너리 로그 이벤트를 식별해서 복제함
- server-id={n}으로 서버를 식별함 각 서버마다 넘버링을 해줘야함 → 이벤트가 처음 발생한 위치를 식별하기 위해 서버 아이디를 지정해야함
글로벌 트랜잭션 ID 기반(GTID)
- MySQL 버전 5.5까지는 바이너리 로그 파일 위치 기반으로만 가능했음 → 식별과정이 소스서버에서만 유효함 , 레플리카서버에 동일한 위치에 저장된다고 보장할 수 없음
  
  MySQL GTID 를 사용한 Replication(복제) 설정

비동기 복제
- 제대로 적용됬는지 확인하지 않음 ,데이터가 100% 일치하지 않음
반동기 복제
- 소스 서버는 레플리카 서버가 소스 서버로부터 전달 받은 변경 이벤트를 릴레이 로그에 기록 후 응답을 보내면 그때 트렌잭션을 커밋함
- 비동기 방식보다 트랜젝션 처리가 느려짐, 응답이안오면 무제한으로 기다릴수있으니 일정시간지나면 비동기 복제로 젼환

싱글 레플리카 복제

멀티 레플리카 복제

체인 복제

듀얼 소스 복제

멀티 소스 복제

저장소에서 병목이 일어날 수 있어서 높은 성능향상을 기대하기 어려울 수도 있다.
Active-Active 방식을 지원 하는 데이터 DBMS가 한정적이다.
( Oracle = RAC(Real Application Cluster, DB2 = pureScale 라는 이름의 Active-Active 클러스터링이 가능하고, 다른 DBMS에서는 Active-Standby 클러스터링만 대응하고 있다.
MySQL에서는 지원해주지 않는 걸로 보임 → MySQL Cluster를 사용하는 것 같은데 InnoDB가 아니라고 함 , 아래에 작성한 Galera cluster를 솔루션으로 사용한다고함
서버를 여러대 한꺼번에 운영하므로 비용이 증가함

클러스터를 구성하는 컴포넌트중 Active만 사용하다가 장애가 생기면 standby가 작동하는 구성
Cold-Standby:평소에 DB가 작동하지 않다가 Active DB에 장애 작동하는 구성
Hot-Standby: 평소에 Standby DB가 작동되는 구성이다.
Hot-standby는 라이선스료를 많이 지급 한다는점에서 단점이 있음
Standby DB 서버는 일정 간격으로 Active DB에 이상이 없는지를 조사하기 위한 통신을 하고 있다. 이 통신을 'Heartbeat'라고 한다. Active DB에 장애가 발생하면 이 신호가 끊기기 때문에Standby 측은 Active가 '죽었다'는 것을 알 수 있다.