DB - 트랜잭션, 장애와 회복, 병행 제어

jsbak·2022년 11월 25일

병행 제어 장애와 회복 트랜잭션

DB

목록 보기

36/36

트랜잭션

데이터베이스는 다수의 사용자가 동시에 사용하더라도 항상 모순이 없는 정확한 데이터를 유지해야 하고 장애 발생시 빠른 시간 내에 원래의 상태로 복구 가능해야한다.

DBMS는 DB 가 항상 정확하고 일관된 상태를 유지할수 있도록 다양한 기능을 제공하는데 이 중심에 있는 것이 트랜잭션이다.

트랜잭션이란?

하나의 작업을 수행하는 데 필요한 데이터베이스의 연산들을 모아 놓은 것
- 논리적인 작업의 단위
- 장애가 발생했을 때 데이터를 복구하는 작업의 단위

트랜잭션의 특성 (ACID)

원자성(atomicity)

트랜잭션을 구성하는 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야한다. (All or Nothing)

장애가 발생하여 성공적으로 완료하지 못했을 때, 현재까지 처리한 연산의 결과를 취소하여 데이터베이스를 트랜잭션 수행 전의 상태로 되돌릴수 있는 회복 기능이 필요.

일관성(consistency)

트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지함을 의미 (병행 제어)

격리성(고립성, isolation)

현재 수행 중인 트랜잭션이 완료될 때까지 트랜잭션이 생성한 중간 연산 결과에 다른 트랜잭션들이 접근할 수 없음을 의미

여러 트랜잭션이 동시에 실행되도 독립적으로 실행 가능 하도록 실행을 제어한다. (병행 제어)

지속성(영속성, durability)

트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 어떠한 경우에도 손실되지 않고 영구적이어야 함을 의미

시스템 장애 발생하더라도 트랜잭션 작업 결과는 없어지지 않고 데이터베이스에 그대로 남아 있어야한다는 의미
시스템 장애 발생 시에도 데이터베이스를 원래 상태로 복원할 수 있는 회복 기능 필요

트랜잭션 연산

commit 연산

트랜잭션이 성공적으로 수행되었음을 선언 (작업 완료)

최종 결과를 데이터베이스에 반영

rollback 연산

트랜잭션이 수행하는데 실패했음을 선언 (작업 취소)

트랜잭션 실행 이전으로 돌아감

장애와 회복

회복(recovery)은 장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구 시키는 것

장애의 유형

유형	설명
트랜잭션 장애	트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태
원인	트랜잭션의 논리적 오류, 잘못된 데이터 입력, 시스템 자원의 과다 사용 요구, 처리 대상 데이터의 부재
시스템 장애	하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태
원인	하드웨어 이상으로 메인 메모리에 저장된 정보가 손실되거나 교착 상태가 발생한 경우 등
미디어 장애	디스크 장치의 결함으로 디스크에 저장된 데이터베이스의 일부 혹은 전체가 손상된 상태
원인	디스크 헤드의 손상이나 고장

데이터 베이스의 저장 연산

데이터베이스는 디스크에 존재하며 데이터를 처리 하기 위해서 데이터를 디스크에서 메인 메모리로 가져와 처리한 후 그 결과를 다시 디스크에 반영하게 된다.

데이터베이스의 저장장치는 다음과 같다.

저장 장치	특징
휘발성	장애가 발생하면 데이터가 손실됨 예) 메인 메모리
비휘발성	장애가 발생해도 저장된 데이터가 손실되지 않음. 단, 저장장치 자체에 이상시 데이터 손실 발생할 수도 예) 디스크, 자기 테이프, CD/DVD
안정 저장 장치	비 휘발성 저장 장치를 이용해 데이터 복사본을 가지고 있는 방법

디스크와 메인 메모리 간의 데이터 이동은 블록 단위로 수행된다.

디스크 블록: 디스크에 있는 블록
버퍼 블록: 메인 메모리에 있는 블록

디스크와 메인 메모리 간의 데이터 이동 연산	프로그램과 메인 메모리 간의 데이터 이동 연산
- input(X) 디스크 블록에 저장된 데이터 X를 버퍼 블록으로 이동	- read(X) 버퍼 블록에 저장되어 있는 데이터 X를 프로그램의 변수로 읽어 오는 연산
- output(X) 버퍼 블록에 있는 데이터 X를 디스크 블록으로 이동	- write(X) 프로그램 변수 값을 버퍼 블록에 있는 데이터 X에 기록하는 연산

회복 기법

데이터베이스에 장애가 발생 했을 때 장애가 발생하기 전의 모순이 없고 일관된 상태로 복구 시키는 것,
DBMS의 회복 관리자는 장애 발생 탐지 및 복구 기능을 제공하며 회복은 빠른 시간 내에 이루어져야한다. ( 복구중 업무 처리 X )

회복을 위한 연산

회복의 핵심 원리는 데이터 중복이다. 별도의 장소에 데이터를 미리 복사해두고 복사본을 이용해 복원하는 것이다.

덤프( dump )	로그( log )
데이터베이스를 사용해 전체를 다른 저장 장치에 주기적으로 복사하는 방법	데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법

덤프나 로그로 저장한 데이터를 이용하여 복구하는 기본 방법

redo(재실행)	undo(취소)
가장 최근에 저장한 데이터베이스 복사본을 가져온 후 로그를 이용해	로그를 이용하여 지금까지 실행된 모든 변경 연산을 취소하여
복사본이 만들어진 후에 실행된 모든 변경 연산을 재실행하여	데이터베이스를 원래의 상태로 복구
장애가 발생하기 직전의 데이터베이스 상태로 복구 ( 주로 손상된 경우에 사용 )	( 변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우 주로 사용 )

로그 회복 기법

즉시 갱신 회복 기법

트랜잭션 수행중에 데이터를 변경한 연산의 결과를 데이터베이스에 즉시 반영
장애 발생에 대비해 데이터 변경에 대한 로그를 기록
- 트랜잭션에서 데이터 변경 연산 실행시 로그 파일에 로그 레코드를 기록한 후 데이터베이스 변경 연산을 수행한다.
장애가 발생하면 로그 파일에 기록된 내용을 참조하여 redo 나 undo 연산 을 실행하여 데이터베이스를 복구

Undo 연산	Redo 연산
트랜잭션이 완료 되기 전 장애가 발생한 경우	트랜잭션이 완료된 후 장애가 발생한 경우
로그파일에 $<T_i,\; start>$ 로그 레코드는 있지만 $<T_i,\; commit>$ 로그 레코드는 없는 경우	로그파일에 $<T_i,\; start>$ , $<T_i,\; commit>$ 로그 레코드는 모두 있는 경우

자연 갱신 회복 기법

트랜잭션이 수행되는 동안에는 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영하지 않고 로그 파일에 기록해 두었다가, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 토대로 데이터베이스에 한 번에 반영
트랜잭션 수행 중 장애 발생 시 로그에 기록된 내용을 버리기만 하면 데이터베이스는 유지된다.
undo는 필요 없고 redo 만 존재하므로 데이터베이스 변경 이전 값을 기록할 필요가 없다.
- $<T_i,\; X,\;new\_value>$ 형식으로 기록

로그 내용을 무시하고 버림	Redo 연산
트랜잭션이 완료 되기 전 장애가 발생한 경우	트랜잭션이 완료된 후 장애가 발생한 경우
로그파일에 $<T_i,\; start>$ 로그 레코드는 있지만 $<T_i,\; commit>$ 로그 레코드는 없는 경우	로그파일에 $<T_i,\; start>$ , $<T_i,\; commit>$ 로그 레코드는 모두 있는 경우

검사 시점 회복 기법

로그를 이용한 경우 로그 전체를 대상으로 회복을 적용 하면 회복 시간이 길어지고 Redo 연산이 필요 없는 경우에도 redo 연산을 실행하는 일이 발생하는데 이런 비효율성을 해결하기 위해 제안된 방법
로그 기록을 이용하나 일정 시간 간격으로 검사 시점(checkpoint)을 만들어 두고 가장 최근 검사 시점 이전의 트랜잭션에는 회복을 적용하지 않는다.
- 불필요한 회복작업을 줄여 회복시간을 단축

미디어 회복 기법

디스크에 발생할 수 있는 장애에 대비한 회복 기법
전체 데이터베이스의 내용을 일정 주기마다 다른 안전한 저장 장치에 복사해 두는 덤프를 이용
- 장애 발생 시 덤프를 이용하여 장애 발생 이전의 상태로 복구한 다음 필요에 따라 로그의 내용을 토대로 Redo 연산을 수행
전체 내용을 다른 저장 장치에 복사해야하기 때문에 비용이 많이 들고, 복사하는 동안 트랜잭션 수행을 중당 해야하므로 CPU 가 낭비 된다는 단점이 있다.

병행 제어 (동시성 제어)

병행 수행 : DBMS에서 여러 사용가자 데이터베이스를 동시에 공유할 수 있도록 여러 개의 트랜잭션이 동시에 수행되는 것
- 인터리빙방식 : 여러 트랜잭션이 동시에 차례대로 번갈아 수행되는 방식
- 문제점: 병행 수행되는 트랜잭션들이 서로 다른 데이터를 사용하여 연산을 실행하는 경우를 제외하고 동시에 같은 데이터에 접근하는 경우 발생
병행 제어 (동시성 제어) : 병행 수행되어 동시에 같은 데이터에 접근 하더라도 문제가 발생하지 않도록 제어

병행 수행의 문제점

갱신 분실 ( lost update )

하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화 되는 것

위의 예시처럼 트랜잭션 T1의 연산 결과가 데이터베이스에 반영되지 않고 무효화 되어 트랜잭션 T1이 수행되지 않은 것처럼 되어버린다. 즉, 트랜잭션 T1에 대해 갱신 분실이 발생한 것이다.

위와 같이 순차적으로 실행된다면 트랜잭션을 수행한 결과를 모두 반영할 수 있게 된다.

모순성 ( inconsistency )

하나의 트랜잭션이 여러 개의 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산을 실행함으로써 모순된 결과가 발생

모순성을 제거하려면 T1에서 x와 y 모두 수행하고 T2가 실행되어야 한다.

연쇄 복귀 ( cascading rollback )

트랜잭션이 완료되기 전 장애가 발생하여 rollback 연산을 수행하면, 장애 발생 전에 이 트랜잭션이 변경한 데이터를 가져가서 변경 연산을 실행한 다른 트랜잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것

T1 이 완전이 끝나고 T2가 순차적으로 실행하도록 했으면 T1 에서 장애가 발생하면 T1 만 Rollback 하고 T2는 Rollback 하지 않아도 된다.

핵심

여러 트랜잭션이 동시에 수행되더라도 연쇄 복귀 문제가 발생하지 않고 마치 트랜잭션을 순차적으로 수행한 것과 같은 결과를 얻는 것이 중요

트랜잭션 스케쥴

트랜잭션에 포함되어 있는 연산들을 수행하는 순서

트랜잭션 스케줄	의미
직렬 스케줄	인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것
비직렬 스케줄	인터리빙 방식을 이용하여 트랜잭션들을 병행해서 수행시키는 것
직렬 가능 스케줄	직렬 스케줄과 같이 정확한 결과를 생성하는 비직렬 스케줄

직렬 스케줄(serial schedule)

의미

인터리빙 방식을 이용하지 않고 각 트랜잭션 별로 연산들을 순착적으로 실행시키는 것

특징

직렬 스케줄에 따라 트랜잭션이 수행되면, 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행되므로 항상 모순이 없는 정확한 결과를 얻게 된다.
다양한 직렬 스케줄이 만들어질 수 있고, 직렬 스케줄마다 데이터베이스에 반영되는 최종 결과가 다를 수 있지만 직렬 스케줄의 결과는 모두 정확하다.
각 트랜잭션을 독립적으로 수행하기 떄문에 병행 수행으로 볼 수 없다.

비직렬 스케줄(nonserial schedule)

의미

인터리빙 방식을 이용하여 트랜잭션을 병행 수행하는 것

특징

트랜잭션이 번갈아 연산을 실행하기 때문에 하나의 트랜잭션이 완료되기 전에 다른 트랜잭션의 연산이 살행될 수 있다
비직렬 스케줄에 따라 병행 수행하면 갱신 분실, 모순성, 연쇄 복귀 등의 문제가 발생할 수 있어 결과의 정확성을 보장할 수 없다.
다양한 비직렬 스케줄이 만들어질 수 있고 그 중에는 잘못된 결과를 생성하는 것도 있다.

직렬 가능 스케줄(serializable schedule)

의미

직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄
비직렬 스케줄 중에서 수행 결과가 동일한 직렬 스케줄이 있는 것

특징

인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있다.
직렬 가능 스케줄인지 판단하는 것은 간단한 작업이 아니므로 직렬 가능성을 보장하는 병행제어 기법을 사용하는 것이 일반적이다.

병행 제어 기법

병행 수행하면서도 직렬 가능성을 보장하기 위한 기법
모든 트랜잭션이 준수하면 직렬 가능성이 보장되는 규약을 정의하고, 트랜잭션들이 이 규약을 따르도록 한다.
대표적인 병행 제어 기법 으로 로킹(Locking) 기법 이 있다.

로킹 기법

한 트랜잭션이 먼저 접근한데이터에 대한 연산을 끝낼 때까지는 다른 트랙잭션이 그 데이터에 접근하지 못하도록 상호 배제 한다.

방법

병행 수행되는 트랜잭션들이 같은 데이터에 동시에 접근하지 못하도록 lock과 unlock 연산을 이용해 제어한다.

lock	unlock
트랜잭션이 데이터에 대한 독점권을 요청하는 연산	트랜잭션이 데이터에 대한 독점권을 반환하는 연산

기본 로킹 규약

트랜잭션은 데이터에 접근하기 위해 먼저 lock 연산을 실행해 독점권을 획득한다. ( read, write 연산을 실행하기 전 lock 실행)
다른 트랜잭션에 의해 이미 lock 연산이 실행된 데이터에는 다시 lock 연산을 실행할 수 없다.
독점권을 획득한 데이터에 대한 모든 연산의 수행이 끝나면 트랜잭션은 unlock 연산을 실행해서 독접권을 반납한다.

로킹 단위

lock 연산을 실행하는 대상 데이터의 크기
전체 데이터베이스부터 릴레이션, 투플, 속성까지도 가능
로킹 단위가 커질수록 병행성은 낮아지지만 제어가 쉽다.
로킹 단위가 작아질수록 제어가 어렵지만 병행성은 높아진다.
로킹 단위에 따른 병행성과 제어간의 트레이드 오프...

기본 로킹 규약의 효율성을 높이기 위한 방법

트랜잭션들이 같은 데이터에 동시에 read 연산을 실행하는 것을 허용한다.
lock 연산은 두 가지 종류

연산	설명
공유락(LS, shared lock)	트랜잭션이 읽기를 할 때 사용하는 lock , 데이터에 대한 사용권을 여러 트랜잭션이 함께 가질 수 있다.
배타락(LX, exclusive lock)	읽고 쓰기를 할 때 사용하는 lock , 실행한 트랜잭션만 해당 데이터에 대한 독점권을 가질 수 있다.

공유락과 배타락을 사용하는 규칙

데이터에 lock이 걸려있지 않으면 트랜잭션은 데이터에 락을 걸 수 있다.
트랜잭션이 데이터 X를 읽기만 할 경우 LS(X)를 요청하고, 읽거나 쓰기를 할 경우 LX(X)를 요청한다.
다른 트랜잭션이 데이터에 LS(X)을 걸어둔 경우, LS(X)의 요청은 허용하고 LX(X)는 허용하지 않는다.
다른 트랜잭션이 데이터에 LX(X)을 걸어둔 경우, LS(X)와 LX(X) 모두 허용하지 않는다.
트랜잭션이 lock을 허용받지 못한다면 대기 상태가 된다.

	공용 lock(LS 상태)	전용 lock(LX 상태)
공용 lock(LS 상태)	가능	불가능
전용 lock(LX 상태)	불가능	불가능

단계 로킹 규약(2PLP; 2 Phase Locking Protocol)

기본 로킹 규약의 문제를 해결하고 트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock 연산의 수행 시점에 대한 새로운 규약을 추가한 것
트랜잭션이 lock과 unlock 연산을 확장 단계와 축소 단계로 나누어 실행

1. 트랜잭션이 처음 수행되면 확장 단계로 들어가 lock 연산만 실행 가능
1. unlock 연산을 실행하면 축소 단계로 들어가 unlock 연산만 실행 가능
따라서 2단계 로킬 규약을 준수하는 트랜잭션은 첫 번째 unlock 연산 실행 전에 필요한 모든 lock 연산을 실행해야 한다.
단점으로는 바로 독점에 대한 문제가 있다.

교착 상태(deadlock)

트랜잭션들이 상대가 독점하고 있는 데이터에 unlock 연산이 실행되기를 서로 기다리면서 트랜잭션의 수행을 중단하고 있는 상태
교착 상태가 발생하지 않도록 예방하거나, 발생 시 탐지하여 필요한 조치를 취해야 한다.

jsbak

끄적끄적 쓰는곳