트랜잭션의 개념
하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아놓은 것, 논리적인 작업의 단위
트랜잭션의 특성(ACID 특성)
트랜잭션의 특성 - 원자성
트랜잭션의 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 하는 all-or-nothing 방식을 의미한다.
만약 트랜잭션 수행 도중 장애가 발생하면 지금까지 실행한 연산처리를 모두 취소하고 DB를 트랜젝션 작업 전 상태로 되돌려놔야 한다.
원자성 보장을 위해 장애 발생 시 회복 기능이 필요하다.
트랜잭션의 특성 - 일관성
트랜잭션의 특성 - 격리성
수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없음을 의미한다.
격리성의 보장을 위해서는 여러 트랜잭션이 동시에 수행되더라도 마치 순서대로 하나씩 수행되는 것처럼 정확하고 일관된 결과를 얻을 수 있도록 제어하는 기능이 필요하다.
트랜잭션의 특성 - 지속성
트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 영구적이어야 함을 의미한다.
지속성의 보장을 위해서는 장애 발생 시 회복 기능이 필요하다.
트랜잭션의 4가지 특성을 보장하기 위해 필요한 기능
트랜잭션의 주요 연산
commit 연산 : 트랜잭션이 성공적으로 수행되었음을 선언 (작업 완료), commit 연산이 실행되면 트랜잭션의 수행 결과가 데이터베이스에 반영되고 일관된 상태를 지속적으로 유지하게 된다.
rollback 연산 : 트랜잭션을 수행하는데 실패했음을 선언 (작업 취소), rollback 연산이 실행되면 트랜잭션이 지금까지 실행한 연산의 결과가 취소되고 데이터베이스가 트랜잭션 수행 전의 일관된 상태로 되돌아간다.
트랜잭션의 상태
활동 상태 : 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태
부분 완료 상태 : 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태
완료 상태 : 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태, 트랜잭션이 수행한 최종 결과를 데이터베이스에 반영하고, 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료됨
실패 상태 : 장애가 발생하여 트랜잭션의 수행이 중단된 상태
철회 상태 : 트랜잭션의 수행 실패로 rollback 연산을 실행한 상태, 지금까지 실행한 트랜잭션의 연산을 모두 취소하고 트랜잭션 수행 전 데이터베이스 상태로 되돌리면서 트랜잭션이 종료, 철회 상태로 종료된 트랜잭션은 상황에 따라 다시 수행되거나 폐기됨
장애 (failure)
시스템이 제대로 동작하지 않는 상태
장애의 유형
트랜잭션 장애 : 트랜잭션 수행 중 오류가 발생하여 수행할 수 없는 상태
시스템 장애 : 하드웨어 결함으로 수행할 수 없는 상태
미디어 장애 : 디스크 장치 결함으로 디스크에 저장된 DB가 손상된 형태
데이터베이스를 저장하는 저장 장치의 종류
저장 장치의 종류
휘발성 저장 장치 (소멸성) : 장애가 발생하면 저장된 데이터가 손실됨 (ex 메인 메모리)
비휘발성 저장 장치 (비소멸성) : 장애가 발생해도 데이터가 손실되지 않음 (ex 디스크)
안정 저장 장치 : 비휘발성 저장 장치로 복사본 여러 개를 만드는 방법으로 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음
회복 (recovery)
장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구시키는 것
트랜잭션의 특성을 보장하고, 데이터베이스를 일관된 상태로 유지하기 위해 필수적인 기능
회복 관리자가 담당
회복을 위해 데이터베이스 복사본을 만드는 방법
데이터베이스 회복의 핵심 원리는 데이터 중복이다.
덤프 (dump) : 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법
로그 (log) : 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법
회복을 위한 기본 연산
redo (재실행) : 최근에 저장한 데이터베이스 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애 발생 직전의 데이터베이스 상태로 복구한다. (전반적으로 손상된 경우에 주로 사용)
undo (취소) : 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래의 상태로 복구한다. (변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우에 주로 사용)
회복 기법
로그 회복 기법 - 즉시 갱신 회복 기법
트랜잭션 수행 중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영
장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록
장애 발생 시점에 따라 redo나 undo 연산을 실행해 데이터베이스를 복구한다.
로그 회복 기법 - 지연 갱신 회복 기법
트랜잭션 수행 중에 데이터 변경 연산의 결과를 로그에만 기록해두고, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터 베이스에 한번에 반영
트랜잭션 수행 중에 장애가 발생할 경우 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 된다.
검사 시점 회복 기법
미디어 회복 기법
디스크에 발생할 수 있는 장애에 대비한 회복 기법
덤프(복사본) 이용
디스크 장애가 발생하면?
병행 수행과 병행제어
병행 수행
여러 사용자가 데이터베이스를 동시 공유할 수 있도록 여러 개의 트랜잭션을 하는 것을 의미
여러 트랜잭션이 번갈아 수행되는 인터리빙(interleaving) 방식으로 진행됨
병행 제어 또는 동시성 제어
병행 수행 시 발생할 수 있는 문제점
갱신 분실
하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화되는 것
여러 트랜잭션이 동시에 수행되더라도 갱신 분실이 발생하지 않고 순차적으로 수행한 것과 같은 결과 값을 얻을 수 있어야 함
모순성
연쇄 복귀
트랜잭션 스케줄
트랜잭션에 포함되어 있는 연산들을 수행하는 순서
직렬 스케줄 : 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것, 독립적으로 수행하기 때문에 병행 수행으로 볼 수 없음
비직렬 스케줄 : 인터리빙 방식을 이용하여 트랜잭션을 병행 수행하는 것, 트랜잭션이 번갈아 연산을 실행하기 때문에 하나의 트랜잭션이 완료되기 전에 다른 트랜잭션의 연산이 실행될 수 있다
직렬 가능 스케줄 : 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄, 인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있다.
병행 제어 기법
의미 : 병행 수행하면서도 직렬 가능성을 보장하기 위한 기법
방법 : 모든 트랜잭션이 준수하면 직렬 가능성이 보장되는 규약을 정의하고, 트랜잭션들이 이 규약을 따르도록 함
대표적인 병행 제어 기법 : 로킹 기법
로킹 (locking) 기법
기본 원리 : 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼 때까지는 다른 트랜잭션이 그 데이터에 접근하지 못하도록 상호 배제한다.
방법 : 같은 데이터에 동시에 접근하지 못하도록 lock과 unlock 연산을 이용해 제어
기본 로킹 규약
트랜잭션은 데이터에 접근하기 위해 먼저 lock 연산을 실행해 독점권을 획득한다.
다른 트랜잭션에 의해 이미 lock연산이 실행된 데이터에는 다시 lock 연산을 실행할 수 없다.
독점권을 획득한 데이터에 대한 모든 연산의 수행이 끝나면 트랜잭션은 unlock 연산을 실행해서 독점권을 반납해야 한다.
기본 로킹 규약의 효율성을 높이기 위한 방법
2단계 로킹 규약
의미 : 기본 로킹 규약의 문제를 해결하고 트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock 연산의 수행 시점에 대한 규약을 추가하는 것
방법 (필요한 데이터를 모두 lock하고 unlock 가능)