[cs 스터디] 4-3. 트랜잭션과 무결성

YooJeeun·2025년 1월 13일

cs 스터디

목록 보기
43/65

트랜잭션

트랜잭션: 데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위
데이터베이스의 접근하는 방법: 쿼리
=> 여러 개의 쿼리를 하나로 묶는 단위를 말한다.

원자성

"all or nothing"
원자성(atomicity): 트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징

1. 홍철의 잔고를 조회한다
2. 홍철에게서 500만 원을 뺀다.
3. 규영에게 500만 원을 넣는다.

이 작업을 '취소'한다고 했을 때 홍철이는 다시 1,000만 원, 규영이는 0원을 가져야 한다.
일부 operation만 적용된 홍철이는 500만 원, 규영이는 0원이 되지 않는다는 뜻이다.

커밋과 롤백
커밋(commit)
: 여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어
트랜잭션 단위로 수행되며 변경된 내용이 모두 영구적으로 저장되는 것을 말한다.
"커밋이 수행되었다" == "하나의 트랜잭션이 성공적으로 수행되었다."


롤백(rollback)
: 트랜잭션으로 처리한하나의 묶음 과정을 일어나기 전으로 돌리는 일을 말한다.


커밋과 롤백의 특징
1. 데이터의 무결성이 보장된다.
2. 데이터 변경 전에 변경 사항을 쉽게 확인할 수 있다.
3. 해당 작업을 그룹화 할 수 있다.


트랜잭션 전파
: 커넥션 객체를 넘겨서 수행하지 않고 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것
트랜잭션을 수행할 때 커넥션 단위로 수행하기 때문에 커넥션 객체를 넘겨서 수행해야 한다. => 매번 하기 번거로우니까 트랜잭션 전파

일관성

일관성(consistency): '허용된 방식'으로만 데이터를 변경해야 한다.

홍철이는 1000만원이 있다.
범석이는 0원이 있다.
-> 범석이는 홍철이에게 500만 원을 입금할 수 없음

격리성

격리성(isolation): 트랜잭션 수행 시 서로 끼어들지 못한다.
복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 하고(그냥 순차적으로 하면 쉽겠지만 그럼 성능이 나빠짐), 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 한다.

격리성은 여러 개의 격리 수준으로 나뉘어 격리성을 보장한다.

격리 수준에 따라 발생하는 현상
: 팬텀 리드, 반복 가능하지 않은 조회, 더티 리드


팬텀 리드(phantom read)
: 한 트랜잭션 내에서 동일한 쿼리를 보냈을 떄 해당 조회 결과가 다른 경우
1. 사용자 A가 회원 테이블에서 age가 12 이상인 회원들을 조회
2. 이 결과로 3개의 테이블을 조회함
3. 사용자 B가 age가 15인 회원을 삽입
4. 그다음에는 네 개의 테이블이 조회됨


반복 가능하지 않은 조회(non-repetable read)
: 한 트랜잭션 내의 같은 행에 두 번 이상 조회가 발생했는데 그 값이 다른 경우
1. 보석 개수가 100개라는 값을 가진 데이터가 있음
2. 사용자 B가 그 값을 1로 변경해서 커밋
3. 사용자 A는 100이 아닌 1을 읽게 됨
팬텀 리드와 다른 점: 반복 가능하지 않은 조회는 행 값이 달라질 수 있는데 팬텀 리드는 다른 행이 선택될 수도 있다는 것을 의미한다.


더티 리드(dirty read)
: 한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 아직 '커밋되지 않은'행의 데이터를 읽을 수 있을 때 발생
반복 가능하지 않은 조회와 유사
1. 사용자 A가 보석 개수를 100을 1로 변경한 내용이 커밋되지 않은 상태
2. 사용자B가 조회한 결과가 1로 나옴


격리 수준
: SERIALIZABLE, REPETABLE_READ, READ_COMMITTED, READ_UNCOMMITTED


SERIALAZABLE
: 트랜잭션을 순차적으로 진행시키는 것
여러 트랜잭션이 동시에 같은 행에 접근할 수 없다.
매우 엄격한 수준으로 해당 행에 대해 격리 시키고 이후 트랜잭션이 일어난다면 기다려야 한다.
-> 교착 상태가 일어날 확률도 많고 가장 성능이 떨어진다.


REPETABLE_READ
: 하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수행할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않는다.
-> 이후에 추가된 행이 발견될 수 있다.
(MySQL8.0의 innoDB 기본값)


READ_COMMITTED
: 커밋 완료된 데이터에 대해서만 조회를 허용한다.
하지만 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있다.
-> 트랜잭션 A가 수정한 행을 트랜잭션 B가 수정할 수 있어서 트랜잭션 A가 같은 행을 다시 읽을 때 다른 내용이 발견될 수 있다.
가장 많이 사용되는 격리 수준이며 PostgreSQL, SQL Server, 오라클에서 기본값으로 설정되어 있다.


READ_UNCOMMITTED
: 트랜잭션이 커밋되지 않은 데이터에도 접근할 수 있는 가장 낮은 수준의 격리 수준이다.
다른 트랜잭션에 노출되는 문제가 있지만 가장 빠르다.
데이터 무결성을 위해서라면 사용하지 않는 것이 이상적이지만 몇몇 행이 제대로 조회되지 않더라도 괜찮은 거대한 양의 데이터를 '어림잡아' 집계하는 데는 사용하면 좋다.

지속성

지속성(durability)
: 성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미한다.
-> 데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복 기능이 있어야 함을 뜻하며 데이터베이스는 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공한다.

체크섬
: 중복 검사의 한 형태로, 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순한 방법이다.


저널링
: 파일 시스템 또는 데이터베이스 시스템에 변경 사항을 반영(commit)하기 전에 로깅ㅇ하는 것, 트랜잭션 등 변경 사항에 대한 로그를 남기는 것

무결성

무결성이란 데이터의 정확성, 일관성, 유효성을 유지하는 것이다.
무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 실제값이 일치하는지에 대한 신뢰성이 생긴다.

이름설명
개체 무결성기본키로 선택된 필드는 빈 값을 허용하지 않음
참조 무결성서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 함
고유 무결성특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가짐
NULL 무결성특정 속성 값에 NULL이올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건
profile
제니벨로그

0개의 댓글