트랜잭션이란 데이터베이스의 상태를 변화시키기 위해 수행하는 작업의 단위이다. 트랜잭션이 일어난 후에는 commit
을 통해 변화를 반영하거나 rollback
이 이루어진다.
트랜잭션이 제공하는 안전성 보장은 흔히 원자성(Atomicity),일관성 (Consistency), 격리성 (isolation), 지속성(Durability)을 의미하는 약어인 ACID로 잘 알려져 있다.
하나의 트랜잭션이 작업이 그중에 일부분만 실행되거나 중단되지 않는것을 보장해주는 것을 말한다.
All or Noting, 하나의 트랜잭션 즉 작업단위에 대해서 전체 성공 혹은 전체 실패만을 보장하며 데이터베이스의 부분적인 갱신으로 더 큰 문제가 야기되는 것을 방지한다.
트랜잭션이 작업이 성공적으로 완료가 되더라도 작업 이전과 같은 일관성 있는 데이터베이스 상태를 유지하는 것을 의미한다.
예를들어 정수 타입의 컬럼에 문자열 값이 들어가 이전과 다른 상태를 가지지 않는 것을 보장한다. 데이터는 미리 정의된 정책에 대해서만 수정이 가능하며 무결성 원칙이 지켜지지 않는 작업은 바로 중단된다.
격리성은 동시에 실행되는 트랜잭션은 서로 격리된다는 것을 의미한다.
Transaction 작업이 수행되고 있을 때 다른 트랜잭션이 끼어들지 못하도록 보장한다. 이것은 트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미한다.
원칙적으로는 트랜잭션이끼리는 서로 간섭을 할 수 없어야 하지만 성능 이슈들이 많아 가장 유연하게 설정이 가능한 제약 조건이다.
성공적으로 수행된 트랜잭션에 대해서 영구히(Persistent) 반영되어야 함을 말한다.
작업이 완료되어 COMMIT까지 된 작업은 시스템 문제가 발생하거나 DB 일관성 체크등을 하더라도 영구적으로 유지 되어야 한다.
여러 트랜잭션이 병행되어 실행될 때 각 트랜잭션의 독립성을 결정한다
즉 해당 트랜잭션이 다른 트랜잭션이 변경한 데이터를 볼 수 있도록 할지말지 결정한다.
모든 트랜잭션은 격리 수준을 갖고 있어야 한다. 다수의 클라이언트로부터 여러 요청이 날라오므로 서버에서는 여러개의 트랜잭션이 동시에 진행될 것이다. 가능하다면 트랜잭션이 순차적으로 실행돼서 다른 트랜잭션의 작업에 독립적인 것이 좋지만, 그렇게 하면 성능이 크게 떨어질 것이다.
따라서 각 트랜잭션마다 적절한 격리 수준을 설정해 가능한 많은 트랜잭션을 동시에 실행시키면서 문제가 발생하지 않게 하는 제어가 필요하다.
Locking
이라는 개념이 존재한다.Locking
은 트랜잭션이 순서대로 처리되며, 이는 DB 성능을 저하시킨다. 반대로, 응답성을 높이기 위해 Locking
범위를 줄인다면 잘못된 값이 처리될 여지가 있다.데이터베이스의 기본 독립성 수준 이용
mySQL의 경우 default로
REPEATABLE_READ
를 사용하고 오라클에서는READ_COMMITTED
를 사용한다고 한다.
아직 커밋하지 않은 변경 데이터도 읽을 수 있음, Dirty Read
데이터 모순 발생 가능
READ COMMITTED 격리 수준에서는 커밋된 데이터만 바라볼 수 있다. 커밋되지 않은 변경된 데이터는 바라보지 않고 최초 select 시점의 undo 로그
를 바라보고 있는다.
그러다 다른 트랜잭션에서 변경한 데이터가 커밋되면 현 트랜잭션에서 조회할 때 값이 바뀌어 Non-repeatable Read
발생 가능
트랜잭션이 시작되고 종료되기 전까지 한 번 조회한 row는 계속 같은 값이 조회된다.
READ_COMMITTED
과는 다르게 트랜잭션이 시작된 시점의 undo log
를 트랜잭션이 종료될 때까지 계속 바라봄으로써 같은값을 조회한다. -> Non-repeatable Read
발생하지 않음
가장 강력한 격리수준 성능이 가장 떨어짐, 한 트랜잭션에서 조회 시 공유락을 걸어 다른 트랜잭션에서 수정하지 못하도록 한다. 동시에 수정하려고 할 경우 순차적으로 트랜잭션을 실행한다.
이를 통해 여러 트랜잭션이 병렬로 실행되더라도 최종 결과는 동시성 없이 한 번에 하나씩 직렬로 실행될 때와 같도록 보장한다.
mysql은 기본적으로 insert, update delete 수행 시 해당 튜플에 대해 x 락을 획득하고 작업한다. SERIALIZABLE를 쓰면 READ 시에도 락을 사용하는 것이다.
READ_UNCOMMITTED
에서 SERIALIZABLE
로 내려올수록 고립 수준이 높아지며 성능이 나빠진다고 할 수 있다.
MVCC(Multi-Version Concurrency Control)
는 동시성을 제어하여 데이터의 일관성을 유지하기 위한 방법이다.
MySQL InnoDB 스토리지 엔진에서 MVCC를 구현하기 위해 스냅샷, Undo 로그 등의 개념을 사용한다.
각 트랜잭션은 시작 시점에 현재 데이터의 스냅샷을 생성하고, 해당 스냅샷으로부터 읽기 작업을 수행한다. 즉, 트랜잭션 시작 시점의 스냅샷으로부터 데이터를 읽으며, 이후에 수행되는 다른 트랜잭션이 데이터를 수정하더라도 해당 트랜잭션에서는 수정 전의 데이터를 읽게 된다.
스냅샷은 트랜잭션 단위로 생성되며, 해당 트랜잭션에서만 유효하다. 이를 통해, 트랜잭션 간에 데이터 일관성을 유지하면서도 동시성을 높일 수 있다.
스냅샷은 MVCC와 함께 사용되는 다른 기능 중 하나인 Undo 로그
를 통해 구현된다.
Undo 로그는 데이터를 변경 했을때 변경 전의 데이터를 보관(백업)하는 곳이다.
이러한 변경 작업은 트랜잭션이 완료되거나 롤백될 때까지 로그에 기록된다. 롤백이나 트랜잭션 실행 도중 문제가 발생하여 복구 작업을 수행할 경우, Undo 로그의 내용을 사용하여 이전 상태로 되돌린다.
Undo 로그는 메모리상에서 관리되는 것이 아니라, 디스크에 기록된다.
독립성 수준(isolation level | Dirty Read | Non-repeatable Read | Phantom Read |
---|---|---|---|
READ_UNCOMMITTED | O | O | O |
READ_COMMITTED | X | O | O |
REPEATABLE_READ | X | X | O |
SERIALIZABLE | X | X | X |
커밋되지 않은 변화사항을 읽을 수 있어 발생하는 문제로 한 트랜잭션(T1)이 데이터에 접근하여 값을 'A'에서 'B'로 변경했고 아직 커밋을 하지 않았을때, 다른 트랜잭션(T2)이 해당 데이터를 Read 하면 T2가 읽은 데이터는 B가 될 것이다. 하지만 T1이 최종 커밋을 하지 않고 종료된다면, T2가 가진 데이터는 꼬이게 된다.
non-repeatable read는 트랜잭션이 같은 행을 최소 두 번 읽지만, 다른 트랜잭션이 같은 행의 데이터를 업데이트하고 동시에(동시에) 커밋하기 때문에 첫 번째와 두 번째 읽기에서 같은 행의 데이터가 다른 경우를 의미한다.
하나의 트랜잭션내에서 똑같은 SELECT 쿼리를 실행했을 때 row는 항상 같은 결과를 가져와야 하는
REPEATABLE READ
의 정합성(무모순성)에 어긋난다.
READ_COMMITTED
와 그보다 낮은 고립 레벨에서 발생할 수 있는 문제이다.
트랜잭션-bob이 실행되고 있는 상태에서 트랜잭션-alice가 update, commit하자 아직 끝나지 않는 트랜잭션-bob가 다시 테이블 값을 읽었을 때 값이 변경됨을 알 수 있다.
이러한 문제는 주로 입금, 출금 처리가 진행되는 금전적인 처리에서 주로 발생한다.
두 개의 다른 쿼리에서 트랜잭션이 일관되지 않은 데이터를 읽는다는 것이다. 1차와 2차 쿼리 사이에 다른 트랜잭션이 데이터를 삽입, 업데이트 또는 삭제하고 커밋하기 때문이다. 마지막으로 일관되지 않은 데이터로 인해 일관되지 않은 결과가 생성된다.
앨리스는 은행에 1,000달러의 저축이 있고 두 계좌에 500달러씩 나눠 놓았다고 하자. 이제 그녀의
계좌 중 하나에서 다른 계좌로 100달러를 전송하는 트랜잭션을 실행한다. 만약 그녀가 운이 없어서 트랜잭션이 처리되고 있는 순간에 계좌 잔고를 보게 되면 한 계좌는 입금이 되기 전 상태(잔고가 500달러 있는를 보고 다른 계좌는 출금이 된 후 상태(잔고가 400달러로 바뀐)를 볼 수도 있다. 앨리스에게는 현재 계좌 총액이 900달러만 있는 것처럼 나온다. 100달러는 연기처럼 사라져 버린 것처럼 보인다.
이런 이상 현상을 비반복 읽기(nonrepeatable read)
나 읽기 스큐(read skew)
라고 한다
어떤 트랜잭션에서 실행한 쓰기가 다른 트랜잭션의 검색 질의 결과를 바꾸는 효과를 팬텀
(phantom)이라고 한다
REPEATABLE_READ
와 그보다 낮은 고립 레벨에서 발생할 수 있는 문제이다.
내가 조회한 자료 값을 내가 바꾸지 않는 이상 트랜잭션 내에서 언제나 조회해도 항상 같은 값을 제공한다는 repeatable read 격리 수준에서 그 조회한 값이 만일 어떤 범위라면, 그 범위 전체를 보관하지 못해서 발생하는 문제로 다른 트랜잭션에서 수행한 변경 작업에 의해 레코드가 보였다가 안 보였다가 하는 현상이다.
이를 방지하기 위해서는 SERIALIZABLE
를 사용한다.
mysql
이 사용하는innoDB
에서는 독특한 특성 때문에REPEATABLE_READ
에서도 팬텀리드가 발생하지 않는다고 한다. (키워드: 넥스트 키 락)
Non-Repeatable Read
와 Phantom Read
는 커밋된 데이터를 읽어들이면서 발생했다는 공통점이 있다.Non-Repeatable Read
는 다른 트랜잭션의 UPDATE 쿼리 후 커밋된 데이터를 읽어서 발생하는 현상(row 범위)이고Phantom Read
는 다른 트랜잭션의 INSERT 쿼리 후 커밋된 데이터를 읽어서 발생한 현상(scope 범위)이다.갱신 손실 문제는 애플리케이션이 데이터베이스에서 값을 읽고 변경한 후 변경된 값을 다시 쓸 때 (read-modify-write 주기) 발생할 수 있다. 만약 두 트랜잭션이 이 작업을 동시에 하면 두 번째 쓰기 작업이 첫 번째 변경을 포함하지 않으므로 변경 중 하나는 손실될 수 있다.
이런 패턴은 다양한 시나리오에서 발생한다.
ex) DB에 저장된 카운터값을 증가시키거나 계좌 잔고를 갱신한다〈현재 값을 읽어서 새 값을 계산하고 갱신된 값을 다시 써야 한다)
lost update는 명시적 잠금을 활용하거나 DB벤더에서 제공하는 원자적 연산 기능, 일부 벤더에서 지원하는 갱신 손실 자동 감지 기능을 활용해 방지할 수 있다.
앨리스와 밥이 어느날 함께 호출 대기를 하고 있다고 상상해보자.
둘 다 몸이 안 좋아서 호출 대기를 그만두기로 결심했다. 불행하게도 그들은 거의 동시에 호출 대기 상태를 끄는 버튼을 클릭했다.
각 트랜잭션에서 애플리케이션은 먼저 현재 두 명 이상의 의사가 대기 중인지 확인한다. 만약 그렇다면 의사 한 명이 호출 대기에서 빠져도 안전하다고 가정한다. 데이터베이스에서 스냅숏 격리를 사용하므로 둘 다 2를 반환해서 두 트랜잭션 모두 다음 단계로 진행한다. 앨리스는 대기 상태를 끄도록 자신의 레코드를 갱신하고 밥도 같은 식으로 자신의 레코드를 갱신한다. 두 트랜잭션 모두 커밋되고 호출 대기하는 의사가 한 명도 없게 된다.
최소 한 명의 의사가 호출 대기해야 한다는 요구사항을 위반했다.
이런 이상 현상을 write skew 라고 한다. 두 트랜잭션이 두 개의 다른 객체를 갱신 하므로(앨리스와 밥이 각자 자신의 호출 대기 레코드를 갱신한다 더티 쓰기도 갱신 손실도 아니다.
쓰기 스큐는 두 트랜잭션이 같은 객체들을 읽어서 그중 일부를 갱신할 때 나타날 수 있다(다른 트랜잭션은 다른 객체를 갱신한다).
다른 트랜잭션이 하나의 동일한 객체를 갱신하는 특별한 경우에 타이밍에 따라 더티 쓰기나 갱신손실 이상 현상을 겪게 된다.
스프링 프레임워크에서 트랜잭션의 경계는 프레젠테이션 층과 비즈니스 로직층 사이에 있다.
전파 속성에 따라 하나의 요청에 트랜잭션이 여러개 생성될 수 있으나 결국 프레젠테이션 층으로 넘어올 때쯤 모든 트랜잭션은 종료될 것이다.
비즈니스 로직층에서는 비즈니스 로직과 데이터액세스로 구성되는데 트랜잭션이 종료되면서 변화 사항을 데이터베이스에 반영하는 commit
을 하거나 로직과 액세스 하나라도 잘못되면 변화사항이 없었던 일이 되도록 rollback
한다.
컨트롤러에서 서비스의 메서드를 실행하면 트랜잭션이 시작되고 메서드 실행을 종료하고 컨트롤러로 돌아갈 때 트랜잭션 종료가 이루어지도록 설계한다.
두가지 트랜잭션 처리 구현 방법이 존재한다. 비즈니스 로직 안에서 트랜잭션의 시작과 끝을 소스코드로 명시하는 명시적인 트랜잭션과 AOP
를 활용하여 스프링이 제공하는 기능을 사용하는 선언적 트랜잭션이다.
AOP
는 프록시 패턴으로 서비스의 메서드가 호출될 때 @Before
영역이 호출되며 트랜잭션이 시작되고 메서드가 끝날 때 @After
영역이 호출되며 커밋이 이루어지도록 한다.
AOP
를 이용한 트랜잭션 처리 시 @Transactionl
어노테이션을 활용한 선언적 트랜잭션, Bean 정의 파일에 의한 선언적 트랜잭션 처리 구현 방법이 있으며 보통 어노테이션을 활용한 선언적 트랜잭션을 사용한다.
트랜잭션의 시작(start)과 종료(commit, rollback)와 트랜잭션의 정의정보를 설정하는 역할을 한다.
트랜잭션의 정의정보는 메서드 단위로 설정한다. 정의 정보는 다음 5가지로 구성되어 있다.
1. 전파 속성
2. 독립성 수준
3. 시간 만료
4. 읽기전용 상태
5. 롤백/커밋 대상 예외
@Service
public class Service1 {
@Transactional
public void something() {
...
...
}
}
@Service
public class Service2 {
@Autowired
private Service1 service1;
@Transactional
public void anything() {
...
service1.somthing();
...
}
}
전파 속성은 어떤 트랜잭션이 동작중인 과정에서 다른 트랜잭션을 실행할 경우 '실행된 트랜잭션을 어떻게 처리하는가'에 대한 개념이다. 여기서는 anything()
메서드 내에서 somthing()
이 실행된 경우이다.
anything()
이 부모 트랜잭션이고 something()
이 자식 트랜잭션일 것이다.
7가지 설정 옵션이 있다.
REQUIRED (Defualt option)
이미 진행중인 트랜잭션(부모 트랜잭션)이 있다면 해당 트랜잭션에 참여하고, 진행중이 아니라면 새로운 트랜잭션을 생성한다.
중간에 롤백이 발생한다면 모두 하나의 트랜잭션이기 때문에 진행사항이 모두 롤백된다.
REQUIRES_NEW
항상 새로운 트랜잭션을 생성한다. 이미 진행중인 트랜잭션(부모 트랜잭션)이 있다면 부모 트랜잭션을 잠깐 중지하고 해당 트랜잭션 작업을 먼저 진행한다.
각각의 트랜잭션이 롤백되더라도 서로 영향을 주지 않는다.
NESTED
진행중인 트랜잭션(부모 트랜잭션)이 있다면 중첩 트랜잭션을 생성한다, 존재하지 않으면 REQUIRED와 동일하게 실행된다.
중첩된 트랜잭션 내부에서 롤백 발생시 해당 중첩 트랜잭션의 시작 지점까지만 롤백이 이루어진다. 중첩 트랜잭션은 부모 트랜잭션이 커밋될 때 같이 커밋되며 부모 트랜잭션이 롤백되면 같이 롤백된다.
SUPPORTS
이미 진행 중인 트랜잭션(부모 트랜잭션)이 있다면 해당 트랜잭션에 참여하고 부모 트랜잭션이 없다면 트랜잭션 없이 진행한다.
NOT_SUPPORTED
이미 진행중인 트랜잭션(부모 트랜잭션)이 있든 없든 해당 메서드는 트랜잭션 없이 진행한다.
MANDATORY
이미 진행중인 트랜잭션(부모 트랜잭션)이 있어야만 작업을 수행한다. 없다면 Exception을 발생시킨다.
NEVER
트랜잭션이 진행중이지 않을 때(부모 트랜잭션이 없으면) 작업을 수행한다. 부모 트랜잭션이 있다면 Exception을 발생시킨다.
트랜잭션을 수행하는 제한시간(timeout)을 설정할 수 있다.
@Transactional(timeout=10)
처럼 사용할 수 있으며, 지정된 시간 내에 메소드 수행이 완료되지 않으면 롤백된다. 이는 트랜잭션을 직접 시작할 수 있는 PROPAGATION_REQUIRED
또는 PROPAGATION_REQUIRES_NEW
와 함께 사용해야만 의미가 있다.
트랜잭션 내의 처리에 대한 읽기전용 여부를 설정한다.
읽기 전용(read only)로 설정해두면 트랜잭션 내에서 데이터를 조작하는 시도를 막아줄 수 있다. 또한 데이터 액세스 기술에 따라서 성능이 향상될 수도 있다. 즉 성능 최적화 또는 쓰기 작업 방지로 사용된다.
일반적으로 읽기 전용 트랜잭션이 시작된 이후 INSERT,UPDATE,DELETE 같은 쓰기 작업이 진행되면 예외가 발생한다. 만약 클래스 레벨에 @Transactional
을 선언한다면, 쓰기 작업을 하지 않는 메소드에는 일일이 readOnly 설정을 해줘야 성능 최적화를 할 수 있다.
스프링의 선언적 트랜잭션에서는 UncheckedException
이 발생하면 롤백하고 CheckedException
이 발생하였다면 롤백하지 않는다.
CheckedException
이 발생할 때 롤백하지 않는 이유는 CheckedException
은 처리를 명시해주어야 하기 때문에 복구가 가능하다고 판단하기 때문이다.
CheckedException
은 대표적으로 IOException
, SQLException
가 있으며 UncheckedException
은 대표적으로 NullPointerException
, IllegalArgumentException
가 있다.
이를 이용해 예외가 발생해도 롤백 대상이지만 커밋하거나, 커밋 대상이지만 롤백시키는 것이 가능하다.
우리는 롤백/커밋의 동작 방식을 변경할 수 있다.
rollbackFor
또는 rollbackForClassName
으로 예외를 지정하여 특정 예외 발생 시 롤백을 시킬 수 있다.
noRollbackFor
또는 noRollbackForClassName
으로 예외를 지정하여 특정 예외 발생 시 진행한 부분까지 커밋하며 롤백시키지 않는다.
Unchecked Exception
는 RuntimeException
을 상속하고 Checked Exception
는 RuntimeException
을 상속하지 않는다.
웹프로그래밍 수업 자료
https://1-7171771.tistory.com/133
https://velog.io/@lsb156/Transaction-Isolation-Level#read-uncommitted
https://velog.io/@kdhyo/JavaTransactional-Annotation-%EC%95%8C%EA%B3%A0-%EC%93%B0%EC%9E%90-26her30h
https://velog.io/@lsb156/Transaction-Isolation-Level
데이터 중심 애플리케이션 설계
https://developyo.tistory.com/51
lock
https://suhwan.dev/2019/06/09/transaction-isolation-level-and-lock/