: 데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위.
데이터에 접근하는 방법은 쿼리, 여러 개의 쿼리들을 하나로 묶는 단위를 말한다.
"all or nothing"
트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징
트랜잭션 단위로 여러 로직들을 묶을 때 외부 API를 호출하는 것이 있으면 안된다. 만약 있다면 롤백이 일어났을 때 어떻게 해야 할 것인지 방법이 있어야하고 트랜잭션 잔파를 신경 써서 관리해야 한다.
트랜잭션 전파
: 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것
'허용된 방식'으로 데이터를 변경해야 하는 것
DB의 모든 데이터는 여러가지 조건, 규칙에 따라 유효함을 가져야한다.
트렌잭션 수행 시 서로 끼어들지 못하는 것.
복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 진행되는 것 처럼 작동 되어야 함.
팬텀 리드
한 트랜잭션 내에서 동일한 쿼리를 보냈을 떄 해당 조회 결과가 다른 경우
ex. A와 age 12 이상 조회 쿼리를 보냄.(조회 시 3명) 그다음 B가 age 15인 회원을 삽입. (4개의 테이블이 조회됨)
반복 가능하지 않은 조회
한 트랜잭션 내의 같은 행에 두 번 이상 조회가 발생, 그 값이 다른 경우.
ex. A는 보석을 100개 가지고 있음. B가 100을 1개로 변경하고 커밋함. 이후 A는 100이 아닌 1을 읽게됨.
팬텀 리드와 다른점은 행의 값이 달라질 수도 있는데, 랜텀 리드는 다른 행이 선택될 수도 있다.
더티 리드
반복 가능하지 않은 조회와 유사
한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 '아직 커밋되지 않은'행의 데이터를 읽을 수 있을 때 발생.
ex. A의 보석을 100에서 1로 변경한 내용을 커밋하지 않은 상태라도 그 이후 사용자 B가 조회한 결과가 1로 나오는 경우
serializable
트랜잭션은 순차적으로 진행시키는 것
교착상태가 일어날 확률이 높고 성능이 떨어진다.
repeatable_read
하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않는다. 따라서 이후에 추가된 행이 발견될 수도 있다
read_committed
가장 많이 사용되는 격리 수준
MySQL8.0, PostgreSQL, SQL, Server, 오라클에서 기본값으로 설정되어 있다.
커밋 완료된 데이터에 대해서만 조회를 허용한다.
하지만 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있다.(A가 수정한 걸 B가 수정할 수 있다. 그래서 A가 다시 조회시 다른 내용을 발견할 수도 있다)
read_uncommitted
가장 낮은 격리 수준.
하나의 트랜잭션이 커밋되기 전에 다른 트랜잭션에 노출되는 문제가 있지만 가장 빠르다.
그렇지만 데이터 무결성을 위해 되도록이면 사용하지 않는걸 권장.
몇몇 행이 재대로 조회되지 않아도 괜찮은 거대한 양의 데이터를 '어림잡아' 집계하는데 사용하면 좋다.
성공적으로 수행된 트랜잭션이 영원이 반영되어야 한다는 것.
DB에 시스템 장애가 발생해도 원래 상태로 복구하는 회복기능이 있어야 한다.
DB는 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공
체크섬
중복 검사의 한 형태. 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순한 방법
저널링
파일 시스템 또는 DB 시스템에 변경 사항을 반영(commit)하기 전에 로깅하는 것,
데이터의 정확성, 일관성, 유효성을 유지하는 것.
무결성이 유지되어야 DB에 저장된 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는지에 대한 신뢰가 생긴다.