DB 동시성 제어

지식저장공간·2023년 5월 30일
0

DB

목록 보기
9/19

Concurrency control

동시성 예제

case 1.

case 2.

case 3.

case 4.

K계좌에서 20만원을 출금하고 H의 계좌에 200만원이 있는것을 확인 한 후 또다른 트랜잭션이 시작이되고, H계좌에 30만원이 입금이되고, 트랜잭션이 끝난 후 기존 트랜잭션이 200만원에 20만원을 입금한다.
이런 현상을 Lost Update라 부른다. (업데이트 된 데이터가 사라진다)

행동하나하나를 operation이라 부르며, write(w), read(r), 트랜잭션명 데이터명으로 구성된다. commit(c)

r1(K) : 트랜잭션1 이 K의 데이터 read
W1(K) : 트랜잭션1 이 K의 데이터 write

Schedule

schedule : 여러 트랜잭션들이 동시에 실행될 때 각 트랜잭션에 속한 operation들의 실행 순서, 각 트랜잭션 내의 operation들의 순서는 바뀌지 않는다.

serial schedule

serial schedule : schedule 1번과 schedule 2번은 transaction들이 겹치지 않고 한번에 하나씩 실행된다. (순차적으로 트랜잭션이 시작한다)

성능

serial schedule의 경우 이상한 데이터, lost update가 발생할 확률이 없다. 하지만, 데이터를 읽고 쓰는 I/O 작업 시 CPU는 해당 작업을 완료할 때 까지 다른것을 하지 않아 처리속도가 느리다.

★현실적으로 사용할 수 없는 방식이다.

nonserial schedule

Nonserial schedule : transaction들이 겹처서 실행되는 schedule

성능

하나의 트랜잭션이 I/O 작업을 진행 중일때 다른 트랜잭션이 시작되고, 트랜잭션들이 겹쳐서 실행되기 때문에 동시성이 높아져서 같은 시간동안 더 많은 트랜잭션들을 처리할 수 있다.

단점

동시에 트랜잭션들이 동작하기 때문에 이상한 결과가 발생할 수 있다.

성능을 향상시키기 위해 Nonserial schedult을 사용하고 싶지만, 이상한 데이터가 나오지 않게 하려면 어떻게 해야할까 ? serial schedule과 동일한 nonserial schedule을 실행하면 된다.

Conflict

두개의 operation이 위 세가지 조건을 만족하면 conflict라 한다.

  1. 서로 다른 트랜잭션
  2. 같은 데이터에 접근
  3. 최소 하나는 write operation(데이터 변경)

read-write conflict

서로 다른 트랜잭션에 속하는 operation들 중 같은 데이터에 접근 하는데, 하나는 read operation 또 다른 하나는 write operation

★conflict operation은 순서가 바뀌면 결과도 바뀐다.

conflict equivalent

트랜잭션 2가 H에 대해 read 그 후 트랜잭션 1이 H에 대해 write하는 순서가 스케쥴 2와 3이 동일하다.

스케쥴2와 3은 conflict equivalent하다

conflict serializable

스케쥴2는 serial schedule이고, 스케쥴3은 nonserial schedule이다.
nonserial schedule이 serial schedule과 conflict equivalent일 때
conflict serializable이라 부른다.

스케쥴3은 nonserial임에도 불구하고 conflict serializable하다.
serial과 결과가 동일하다.

  1. 서로 동일한 트랜잭션을 가진다 -> O
  2. operation 순서가 동일하다 -> X

구현

conflict serializable한 스케쥴만 실행되도록 보장하는 프로토콜을 사용한다.

concurrency control이 어떤 스케쥴이던 serializable하게 만들어준다.

Recoverability

unrecoverable schedule

그러나, 트랜잭션1은 이미 commit된 상태이므로 durability 속성 때문에 rollback할 수 없다.

commit된 트랜잭션이 rollback된 트랜잭션이 write했었던 데이터를 읽은 경우 : rollback을 해도 이전 상태로 회복 불가능할 수 있기 때문에 이런 schedule은 DBMS가 허용하면 안된다.

recoverable schedule

트랜잭션2가 먼저 commit된 후 트랜잭션1이 commit되어야한다. 트랜잭션2가 rollback한 경우 트랜잭션1도 rollback이 되어야한다.

rollback할 때 이전 상태로 온전히 돌아갈 수 있기 때문에 DBMS는 이런 schedule만 허용해야 한다.

문제점

cascading schedule이라 불린다. 하나의 트랜잭션이 롤백을 수행하면 모든 트랜잭션이 롤백을 해야하기 때문에 비용이 많이 든다.

따라서, 다른 트랜잭션에 존재하는 데이터를 사용하고 싶은경우 write한 트랜잭션이 먼저 commit또는 rollback이 된 후에 데이터를 사용하는 schedule만을 사용하도록 한다.

cascadeless schedule

트랜잭션2가 문제가 생겨 롤백을 해도 트랜잭션2만 롤백하면되고, 트랜잭션1은 롤백된 데이터에 20만원을 추가한다.

strict schedule

schedule 내에서 어떤 transaction도 commit되지 않은 transaction들이 write한 데이터는 쓰지도, 읽지도 않는다.

rollback할 때 recovery가 쉽다. transaction 이전 상태로 돌려 놓기만 하면된다.

출처 : 쉬운코드 유튜브

정리

unrecoverable schedule : 회복이 불가능한 스케쥴

recoverable schedule : 회복이 가능한 스케쥴

cascadeless schedule : 회복이 가능한 스케쥴 중 연속적인 롤백이 일어나지 않는 스케쥴

strict schedule : write한 데이터가 commit / rollback 되기 전까지는 다른 트랜잭션은 해당 데이터를 이용할 수 없다.

profile
발전하는 개발자가 꿈입니다. 지식을 쌓고 지식을 활용해 목표 달성을 추구합니다.

0개의 댓글