DB 트랜잭션 (Transaction)의 ACID 속성과 분산시스템 BASE 속성

Moonlog·2020년 12월 14일
1

DataBase

목록 보기
3/3
post-thumbnail

트랜잭션 (Transaction) 이란?

  • 데이터베이스의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산들을 의미한다.

  • 트랜잭션은 데이터베이스 시스템에서 병행 제어 및 회복 작업 시 처리되는 작업의 논리적 단위이다.

  • 사용자가 시스템에 대한 서비스 요구 시 시스템이 응답하기 위한 상태 변환 과정의 작업단위이다.


ACID란?

  • 데이터베이스 트랜잭션이 안전하게 수행된다는 것을 보장하기 위한 성질

    1. 원자성 (Atomicity)

    • 트랜잭션의 연산은 데이터베이스에 모두 반영되든지 아니면 전혀 반영되지 않아야 한다.
    • 트랜잭션 내의 모든 명령은 반드시 완벽히 수행되어야 하며, 모두가 완벽히 수행되지 않고 어느하나라도 오류가 발생하면 트랜잭션 전부가 취소되어야 한다.

    2. 일관성 (Consistency)

    • 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환한다.
    • 시스템이 가지고 있는 고정요소는 트랜잭션 수행 전과 트랜잭션 수행 완료 후의 상태가 같아야 한다.

    3. 독립성, 격리성 (Isolation)

    • 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행중에 다른 트랜잭션의 연산이 끼어들 수 없다.
    • 수행중인 트랜잭션은 완전히 완료될 때까지 다른 트랜잭션에서 수행 결과를 참조할 수 없다.

    4. 영속성, 지속성 (Durablility)

    • 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라도 영구적으로 반영되어야 한다.

- 트랜잭션 (Transaction) 연산 및 상태

  • Commit 연산
    • Commit 연산은 한개의 논리적 단위(트랜잭션)에 대한 작업이 성공적으로 끝났고 데이터베이스가 다시 일관된 상태에 있을 때, 이 트랜잭션이 행한 갱신 연산이 완료된 것을 트랜잭션 관리자에게 알려주는 연산이다.
  • Rollback 연산
    • Rollback 연산은 하나의 트랜잭션 처리가 비정상적으로 종료되어 데이터베이스의 일관성을 깨뜨렸을 때, 이 트랜잭션의 일부가 정상적으로 처리되었더라도 트랜잭션의 원자성을 구현하기 위해 이 트랜잭션이 행한 모든 연산을 취소(Undo)하는 연산이다.
    • Rollback시에는 해당 트랜잭션을 재시작하거나 폐기한다.

활성(Active) : 트랜잭션이 정상적으로 실행중인 상태
실패(Failed) : 트랜잭션 실행에 오류가 발생하여 중단된 상태
철회(Aborted) : 트랜잭션이 비정상적으로 종료되어 Rollback 연산을 수행한 상태
부분 완료(Partially Committed) : 트랜잭션의 마지막 연산까지 실행했지만, Commit 연산이 실행되기 직전의 상태
완료(Committed) : 트랜잭션이 성공적으로 종료되어 Commit 연산을 실행한 후의 상태


BASE란?

  • ACID와 대조적으로 가용성과 성능을 중시하는 특성을 가진 분산 시스템의 특성

    1. 기본적인 가용성 (Basically Avaliable)

    • 부분적인 고장은 있을 수 있으나, 나머지는 사용이 가능하다.
      * 주 서버가 안되더라도 백업 서버는 동작한다.

    2. 소프트 상태 (Soft State)

    • 노드의 상태는 외부에서 전송된 정보를 통해 결정됨.
    • 분산 노드 간 업데이트는 데이터가 노드에 도달한 시점에 갱신.
      * 최신 상태의 데이터로 덮어써진다.

    3. 결과적 일관성 (Eventually Consistent)

    • 일시적으로 비일관적인 상태가 되어도 최적으로는 일관성이 있는 상태가 되는 성질
      * 시스템 부하, 네트워크 속도 등의 외부 요인으로 인해 일관성이 일시적으로 깨질 수 있다.

BASE 원칙은 전통의 트랜잭션 시스템을 위한 ACID 원칙에 반대되는데, 이는 분산 환경에서 나타나는 특징이기 때문이다.

이러한 특징에 대해 CAP이론은 다음 3가지 조건을 모두 만족하는 분산 시스템을 만드는 것이 불가능함을 정의한다.

- 일관성 (Consistency) : 모든 시스템의 데이터는 어떤 순간에 항상 같은 데이터를 갖는다.
- 가용성 (Availability) : 분산 시스템에 대한 모든 요청은 내용 혹은 성공/실패에 상관없이 응답을 반환할 수 있다.
- 내구성 (Partition Tolerance) : 네트워크 장애 등 여러 상황에서도 시스템은 동작할 수 있다.

위의 3가지 성질을 모두 만족할 수 없고, 일반적으로 다음과 같이 선택된다.

- CP (Consistency & Partition Tolearance) : 
    어떤 상황에서도 안정적으로 시스템은 운영되지만 Consistency 가 보장되지 않는다면 Error를 반환한다. (어떤 경우에도 데이터가 달라져서는 안된다.)
    * 이는 매 순간 Read/Write에 따른 정합성이 일치할 필요가 있는 경우 적합한 형태이다.

- AP (Availability & Partition Tolerance) : 
    어떤 상황에서도 안정적으로 시스템은 운영된다. 또한 데이터와 상관없이 안정적인 응답을 받을 수 있다. 
    다만 데이터의 정합성에 대한 보장은 불가능하다. (특정 시점에 Write 동기화 여부에 따라 데이터가 달라질 수 있다.)
    * 이는 결과적으로는 일관성이 보장된다는 Eventual Consistency를 보장할 수 있는 시스템에 알맞는 형태이다.

* 정리

ACID란 관계형 데이터베이스 (RDBMS)에서 트랜잭션이 안전하게 수행된다는 것을 보장하는 특성이고, BASE는 가용성과 성능을 중시한 분산 시스템의 특성이다.


속성BASEACID
적용분야NoSQLRDBMS
범위시스템 전체에 대한 특성트랙잭션에 한정
일관성측면약한 일관성강한 일관성
중점사항Acailavility'Commit'에 집중
시스템측면성능에 초점엄격한 데이터관리
효율성쿼리디자인이 중요테이블 디자인이 중요

* 참고

profile
Start 20.12.10 ~ ing

0개의 댓글