Transaction Isolation Level 정리

Ssabae·2020년 8월 22일
11
post-thumbnail

Transaction Isolation

Table of Contents

A.C.I.D란?

Isolation을 알기전에 먼저 트랜잭션이 중요시 여기는 ACID라는 것을 먼저 알아야 합니다.
Atomicity, Consistency, Isolation, Durability의 앞글자를 따서 ACID라고 불리웁니다.

원자성 ( Atomicity )

하나의 트랜잭션이 작업이 그중에 일부분만 실행되거나 중단되지 않는것을 보장해주는 것을 말합니다.
All or Noting 즉, 작업단위에 대해서 전체 성공 혹은 실패만을 보장하며 일부분만 작업하여 반영하지 않습니다.

일관성 ( Consistency )

트랜잭션이 작업이 성공적으로 완료가 되더라도 작업 이전과 같이 같은 상태를 유지하는 것을 말합니다.
예를들어 정수 타입의 컬럼에 문자열 값이 들어가지 않는것을 보장하여 줍니다.
데이터는 미리 정의된 정책에 대해서만 수정이 가능하며 무결성원칙이 지켜지지 않는 작업은 바로 중단이 됩니다.

격리성 ( Isolation )

Transaction 작업이 수행되고 있을 때 다른 작업이 끼어들지 못하도록 보장해주는 것을 말합니다.
원칙적으로는 트랜잭션이끼리는 서로 간섭을 할 수 없어야 하지만 성능 이슈들이 많아 가장 유연하게 설정이 가능한 제약 조건입니다.

지속성 ( Durability )

성공적으로 수행된 트랜잭션이에 대해서 영구히(Persistent) 반영되어야 함을 말합니다.
작업이 완료되어 COMMIT까지 된 작업은 시스템 문제나 DB 일관성 체크등을 하더라도 영구적으로 유지 되어야 합니다.
전형적으로 모든 트랜잭션은 로그로 남고 시스템 장애 발생 전 상태로 되돌릴 수 있습니다.

Transaction의 정의

트랜잭션이란, Database의 데이터를 조작하는 작업의 단위(Unit Of Work)입니다.
가장 많이 드는 예시는 은행에서 A가 B에서 송금을 하는 예시가 가장 대표적입니다.

A가 B에세 1,000원을 송금한다고 가정했을시 시나리오는 다음과 같습니다.

  1. A의 계좌에서 1,000원을 차감
  2. B의 계좌에 1,000원을 추가

만약 이때 B의 계좌를 관리하는 은행에서 이유를 알수없는 오류로 추가가 되지 않는다면 A의 계좌에서 돈만 차감되게 되어 장애로 연결이 됩니다. 이를 보장하기 위해서 모든 작업들은 트랜잭션 단위로 묶어서 처리를 해야합니다.

Isolation Level

ACID의 원칙을 너무 타이트하기 지키면 동시성(Concurrency)에 대한 퍼포먼스가 너무 떨어지기 때문에 Isolation Level별로 차등을 두어 동시성에 대한 이점을 가질 수 있게 하지만 아무래도 문제가 발생할 가능성이 커집니다.

ANSI/ISO SQL Standard 에서 정의한 Isolation Level은 다음과 같습니다.

  • READ UNCOMMITTED
  • READ COMMITTED
  • REPEATABLE READ
  • SERIALIZABLE

이제 각 항목에 대해서 자세히 알아보도록 하겠습니다.

ANSI (American National Standards Institute) : 미국 국립 표준 협회
ISO ( International Organization for Standardization ) : 국제 표준화 기구

READ UNCOMMITTED

SELECT 쿼리 실행시에 다른 트랜잭션에서 COMMIT 되지 않은 데이터를 읽어올 수 있습니다.
COMMIT 되지 않은 데이터를 읽는 현상을 Dirty read라고 말합니다.
INSERT만 진행되고 ROLLBACK 될 수도 있는, 즉 한번도 COMMIT 되지 않은 데이터를 읽을 수 있어 유의해야합니다.

Postgresql에서 READ UNCOMMITTED 레벨을 지원하지 않음

READ COMMITTED

Read Committed에서는 COMMIT이 완료된 데이터만 SELECT시에 보이는 수준을 보장하는 Level이며 대부분의 DBMS에서 Read Committed를 기본으로 설정합니다.

Read Committed에서는 Read Uncommitted에서 발생하는 Dirty read가 발생하지 않도록 보장해줍니다.

트랜잭션에서 COMMIT을 수행하지 않더라도 DB에 이미 값이 반영이 되어있는 상태인데 COMMIT이전의 데이터를 보장 받기 위해서는 COMMIT 되지 않은 쿼리를 복구하는 과정이 필요하게 됩니다.
즉, 이 시점에서는 Consistent Read를 수행해야 함을 의미합니다.

Read Committed의 문제는 하나의 트랜잭션 안에서 SELECT를 수행 할 때마다 데이터가 동일하다는 보장을 해주지 않습니다. 그 이유는 다른 트랜젝션에서 해당 데이터를 COMMIT 했을 경우에는 COMMIT된 데이터를 반환해주는게 Read Committed의 특징이기 때문입니다.
위와 같은 이유로 Read CommittedNon-repeatable Read 라고도 합니다.

Consistent Read
Consistent read란 read(=SELECT) operation을 수행할 때 현재 DB의 값이 아닌 특정 시점의 DB snapshot을 읽어오는 것이다. 물론 이 snapshot은 commit 된 변화만이 적용된 상태를 의미한다.

REPEATABLE READ

Read Committed와는 다르게 Repeatable Read는 한 트랜잭션 안에서 반복해서 SELECT를 수행하더라도 읽어 들이는 값이 변화하지 않음을 보장합니다.

Repeatable Read 트랜잭션은 처음으로 SELECT을 수행한 시간을 기록한 뒤 그 이후에는 모든 SELECT 마다 해당 시점을 기준으로 Consistent Read를 수행하여줍니다.
그러므로 트랜잭션 도중 다른 트랜잭션이 COMMIT 되더라도 새로이 COMMIT 된 데이터는 보이지 않게됩니다.
그 이유는 첫 SELECT 시에 생성된 SNAPSHOT을 읽기 때문입니다.

SERIALIZABLE

Serializable은 모든 작업을 하나의 트랜젝션에서 처리하는 것과 같은 가장 높은 고립수준을 제공합니다.

Read Committed, Repeatable Read 두개의 공통적인 이슈는 Phantom Read가 발생한다는 점입니다.

Phantom Read
하나의 트랜잭션에서 UPDATE 명령이 유실되거나 덮어써질수 있는 즉, UPDATE후 COMMIT하고 다시 조회를 했을때 예상과는 다른 값이 보이거나 데이터가 유실된 경우를 Phantom Read라고 한다.

그와 다르게 SERIALIZABLE에서는 SELECT 쿼리가 전부 SELECT ... FOR SHARE로 자동으로 변경되어 Repeatable Read에서 막을 수 없는 몇 가지 상황을 방지할 수 있게됩니다.

두개의 트랜잭션이 서로 업데이트를 하는 상황을 예를들어 설명해 보겠습니다.

(A-1) SELECT state FROM account WHERE id = 1;
(B-1) SELECT state FROM account WHERE id = 1;
(B-2) UPDATE account SET state = ‘rich’, money = money * 1000 WHERE id = 1;
(B-3) COMMIT;
(A-2) UPDATE account SET state = ‘rich’, money = money * 1000 WHERE id = 1;
(A-3) COMMIT;
  1. (A-1)SELECT 쿼리가 SELECT ... FOR SHARE로 바뀌면서 id = 1 인 row에 S Lock을 겁니다.
  2. (B-1)SELECT 쿼리 역시 id = 1인 row에 S Lock을 겁니다.
  3. A와 B가 각각 (B-2), (A-2) UPDATE 쿼리를 실행하려고 하면 row에 X Lock을 시도합니다.
  4. 이미 해당 row에는 S Lock이 걸려있어 DEADLOCK 상황에 빠집니다.
  5. 두 트랜잭션 모두 DEADLOCK으로 인한 Timeout으로 실패하여 데이터는 변경되지 않고 원래대로 남아있게 됩니다.

위 경우에서 알 수 있듯이, SERIALIZABLE은 데이터를 안전하게 보호할 수는 있지만 굉장히 쉽게 DEADLOCK에 걸릴 수 있다. 따라서 SERIALIZABLEDEADLOCK이 걸리지 않는지 신중하게 계산하고 사용해야 합니다.

S Lock : ( Shared lock, 공유 잠금 )
읽기 잠금(Read lock)이라고도 불린다.
어떤 트랜잭션에서 데이터를 읽고자 할 때 다른 shared lock은 허용이 되지만 exclusive lock은 불가하다.
쉽게 말해 리소스를 다른 사용자가 동시에 읽을 수 있게 하되 변경은 불가하게 하는 것이다.
=> 어떤 자원에 shared lock이 동시에 여러개 적용될 수 있다.
=> 어떤 자원에 shared lock이 하나라도 걸려있으면 exclusive lock을 걸 수 없다.

X Lock : ( Exclusive lock, 배타적 잠금 )
쓰기 잠금(Write lock)이라고도 불린다.
어떤 트랜잭션에서 데이터를 변경하고자 할 때(ex . 쓰고자 할 때) 해당 트랜잭션이 완료될 때까지 해당 테이블 혹은 레코드(row)를 다른 트랜잭션에서 읽거나 쓰지 못하게 하기 위해 Exclusive lock을 걸고 트랜잭션을 진행시키는 것이다.
=> exclusive lock에 걸리면 shared lock을 걸 수 없다. (shared lock은 아래에서 설명)
=> exclusive lock에 걸린 테이블,레코드등의 자원에 대해 다른 트랜잭션이 exclusive lock을 걸 수 없다.

RX, RS, S, SRX, X등 다양한 Lock이 존재.

CRUD에 적절한 ISOLATION LEVEL

  • Read시에는 REPEATABLE READ
  • Create, Update, Delete 때는 SERIALIZABLE

UPDATE나 DELETE는 Consistent Read의 적용을 받지 않는다는 것입니다.
즉, 같은 WHERE 조건을 사용하더라도, 내가 수정하려고 SELECT 쿼리로 읽어온 row와 해당 row들을 수정하기 위해 UPDATE 쿼리를 날렸을 때 실제로 수정되는 row가 다를 수 있습니다.

참고
https://suhwan.dev/2019/06/09/transaction-isolation-level-and-lock/
https://nesoy.github.io/articles/2019-05/Database-Transaction-isolation
https://medium.com/@chrisjune_13837/db-transaction-isolation-level-f21b6d1e64eb
https://jeong-pro.tistory.com/94

profile
Front-End 부터 Back-End 까지 잘 하고 싶은 개발자

0개의 댓글