[DB] ch12 트랜잭션과 병행수행 제어

박소미·2023년 12월 10일
0

DB

목록 보기
12/14

12.1 트랜잭션

트랜잭션의 개념

하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아놓은 것, 논리적인 작업의 단위

트랜잭션의 특성(ACID 특성)

  • 원자성 (Atomicity)
  • 일관성 (Consistency)
  • 격리성 (Isolation)
  • 지속성 (Durability)

트랜잭션의 특성 - 원자성

  • 트랜잭션의 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 하는 all-or-nothing 방식을 의미한다.

  • 만약 트랜잭션 수행 도중 장애가 발생하면 지금까지 실행한 연산처리를 모두 취소하고 DB를 트랜젝션 작업 전 상태로 되돌려놔야 한다.

  • 원자성 보장을 위해 장애 발생 시 회복 기능이 필요하다.


트랜잭션의 특성 - 일관성

  • 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함을 의미한다.

트랜잭션의 특성 - 격리성

  • 수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없음을 의미한다.

  • 격리성의 보장을 위해서는 여러 트랜잭션이 동시에 수행되더라도 마치 순서대로 하나씩 수행되는 것처럼 정확하고 일관된 결과를 얻을 수 있도록 제어하는 기능이 필요하다.

트랜잭션의 특성 - 지속성

  • 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 영구적이어야 함을 의미한다.

  • 지속성의 보장을 위해서는 장애 발생 시 회복 기능이 필요하다.


트랜잭션의 4가지 특성을 보장하기 위해 필요한 기능

트랜잭션의 주요 연산

commit 연산 : 트랜잭션이 성공적으로 수행되었음을 선언 (작업 완료), commit 연산이 실행되면 트랜잭션의 수행 결과가 데이터베이스에 반영되고 일관된 상태를 지속적으로 유지하게 된다.

rollback 연산 : 트랜잭션을 수행하는데 실패했음을 선언 (작업 취소), rollback 연산이 실행되면 트랜잭션이 지금까지 실행한 연산의 결과가 취소되고 데이터베이스가 트랜잭션 수행 전의 일관된 상태로 되돌아간다.


트랜잭션의 상태

활동 상태 : 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태

부분 완료 상태 : 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태

완료 상태 : 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태, 트랜잭션이 수행한 최종 결과를 데이터베이스에 반영하고, 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료됨

실패 상태 : 장애가 발생하여 트랜잭션의 수행이 중단된 상태

철회 상태 : 트랜잭션의 수행 실패로 rollback 연산을 실행한 상태, 지금까지 실행한 트랜잭션의 연산을 모두 취소하고 트랜잭션 수행 전 데이터베이스 상태로 되돌리면서 트랜잭션이 종료, 철회 상태로 종료된 트랜잭션은 상황에 따라 다시 수행되거나 폐기됨

12.2 장애와 회복

장애 (failure)
시스템이 제대로 동작하지 않는 상태

장애의 유형

  • 트랜잭션 장애 : 트랜잭션 수행 중 오류가 발생하여 수행할 수 없는 상태

  • 시스템 장애 : 하드웨어 결함으로 수행할 수 없는 상태

  • 미디어 장애 : 디스크 장치 결함으로 디스크에 저장된 DB가 손상된 형태


데이터베이스를 저장하는 저장 장치의 종류

저장 장치의 종류

  • 휘발성 저장 장치 (소멸성) : 장애가 발생하면 저장된 데이터가 손실됨 (ex 메인 메모리)

  • 비휘발성 저장 장치 (비소멸성) : 장애가 발생해도 데이터가 손실되지 않음 (ex 디스크)

  • 안정 저장 장치 : 비휘발성 저장 장치로 복사본 여러 개를 만드는 방법으로 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음


회복 (recovery)

  • 장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구시키는 것

  • 트랜잭션의 특성을 보장하고, 데이터베이스를 일관된 상태로 유지하기 위해 필수적인 기능

  • 회복 관리자가 담당

    • 장애 발생을 탐지하고 장애가 탐지되면 데이터베이스 복구 기능을 제공

회복을 위해 데이터베이스 복사본을 만드는 방법
데이터베이스 회복의 핵심 원리는 데이터 중복이다.

  • 덤프 (dump) : 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법

  • 로그 (log) : 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법

회복을 위한 기본 연산

redo (재실행) : 최근에 저장한 데이터베이스 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애 발생 직전의 데이터베이스 상태로 복구한다. (전반적으로 손상된 경우에 주로 사용)

undo (취소) : 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래의 상태로 복구한다. (변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우에 주로 사용)


회복 기법

로그 회복 기법 - 즉시 갱신 회복 기법

  • 트랜잭션 수행 중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영

  • 장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록

    • 로그 파일에 로그 레코드를 먼저 기록한 다음 데이터베이스에 변경 연산을 반영
  • 장애 발생 시점에 따라 redo나 undo 연산을 실행해 데이터베이스를 복구한다.

로그 회복 기법 - 지연 갱신 회복 기법

  • 트랜잭션 수행 중에 데이터 변경 연산의 결과를 로그에만 기록해두고, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터 베이스에 한번에 반영

  • 트랜잭션 수행 중에 장애가 발생할 경우 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 된다.

    • undo 연산은 필요없고 redo 연산만 사용한다.
    • 로그 레코드에는 변경 이후 값만 기록하면 된다.

검사 시점 회복 기법

  • 로그 기록을 이용하되, 일정 시간 간격으로 검사 시점(checkpoint)을 만듦
  • 장애 발생 시 가장 최근 검사 시점 이후의 트랜잭션에만 회복 작업 수행

미디어 회복 기법

  • 디스크에 발생할 수 있는 장애에 대비한 회복 기법

  • 덤프(복사본) 이용

    • 데이터베이스 내용을 일정 주기마다 다른 안전한 저장장치에 복사
  • 디스크 장애가 발생하면?

    • 최근에 복사해둔 덤프를 이용해 장애 발생 이전의 데이터베이스 상태로 복구하고 필요에 따라 redo 연산을 수행한다.

12.3 병행 수행 제어

병행 수행과 병행제어

병행 수행

  • 여러 사용자가 데이터베이스를 동시 공유할 수 있도록 여러 개의 트랜잭션을 하는 것을 의미

  • 여러 트랜잭션이 번갈아 수행되는 인터리빙(interleaving) 방식으로 진행됨

병행 제어 또는 동시성 제어

  • 병행 수행 시 같은 데이터에 접근하여 연산을 실행해도 문제가 발생하지 않고 정확한 수행 결과를 얻을 수 있도록 제어하는 것을 의미한다.

병행 수행 시 발생할 수 있는 문제점

갱신 분실

  • 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화되는 것

  • 여러 트랜잭션이 동시에 수행되더라도 갱신 분실이 발생하지 않고 순차적으로 수행한 것과 같은 결과 값을 얻을 수 있어야 함

모순성

  • 하나의 트랜잭션이 여러 개 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산함으로써 모순된 결과가 발생하는 것

연쇄 복귀

  • 트랜잭션이 완료되기 전 장애가 발생하여 rollback 연산을 수행하면, 장애 발생 전에 이 트랜잭션이 변경한 데이터를 가져가서 변경 연산을 실행한 다른 트랜잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것

트랜잭션 스케줄
트랜잭션에 포함되어 있는 연산들을 수행하는 순서

  • 직렬 스케줄 : 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것, 독립적으로 수행하기 때문에 병행 수행으로 볼 수 없음

  • 비직렬 스케줄 : 인터리빙 방식을 이용하여 트랜잭션을 병행 수행하는 것, 트랜잭션이 번갈아 연산을 실행하기 때문에 하나의 트랜잭션이 완료되기 전에 다른 트랜잭션의 연산이 실행될 수 있다

  • 직렬 가능 스케줄 : 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄, 인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있다.


병행 제어 기법
의미 : 병행 수행하면서도 직렬 가능성을 보장하기 위한 기법

방법 : 모든 트랜잭션이 준수하면 직렬 가능성이 보장되는 규약을 정의하고, 트랜잭션들이 이 규약을 따르도록 함

대표적인 병행 제어 기법 : 로킹 기법

로킹 (locking) 기법
기본 원리 : 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼 때까지는 다른 트랜잭션이 그 데이터에 접근하지 못하도록 상호 배제한다.

방법 : 같은 데이터에 동시에 접근하지 못하도록 lock과 unlock 연산을 이용해 제어

  • lock : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
  • unlock : 트랜잭션이 데이터에 대한 독점권을 반환하는 연산

기본 로킹 규약

  • 트랜잭션은 데이터에 접근하기 위해 먼저 lock 연산을 실행해 독점권을 획득한다.

    • read 또는 write 연산을 실행하기 전 lock 연산을 실행
  • 다른 트랜잭션에 의해 이미 lock연산이 실행된 데이터에는 다시 lock 연산을 실행할 수 없다.

  • 독점권을 획득한 데이터에 대한 모든 연산의 수행이 끝나면 트랜잭션은 unlock 연산을 실행해서 독점권을 반납해야 한다.

기본 로킹 규약의 효율성을 높이기 위한 방법

  • 트랜잭션들이 같은 데이터에 동시에 read 연산을 실행하는 것을 허용
  • 공용 lock과 전용 lock, 두 종류로 구분하여 사용
    • 공용 lock : read만 가능, lock을 동시에 실행 가능
    • 전용 lock : read write 가능, lock 연산 실행 불가

2단계 로킹 규약
의미 : 기본 로킹 규약의 문제를 해결하고 트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock 연산의 수행 시점에 대한 규약을 추가하는 것

방법 (필요한 데이터를 모두 lock하고 unlock 가능)

  • 트랜잭션이 lock과 unlock 연산을 확장 단계와 축소 단계로 나누어 실행
    • 트랜잭션이 처음 수행되면 확장 단계로 들어가 lock 연산만 실행 가능
    • unlock 연산을 실행하면 축소 단계로 들어가 unlock 연산만 실행 가능

0개의 댓글