[면접을 위한 CS 지식 노트] 데이터베이스 트랜잭션과 무결성

재오·2023년 5월 28일
8

CS

목록 보기
19/35
post-thumbnail

트랜잭션

트랜잭션은 데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위를 말하며 데이터베이스에 접근하는 방법은 쿼리이므로, 여러 개의 쿼리들을 하나로 묶는 단위를 말한다. 이에 대한 특징으로 원자성, 일관성, 격리성, 지속성이 있으며 이를 ACID 특징이라고 한다.

원자성

원자성은 트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징이다.
예를 들어 1000만원을 가진 홍철이가 0원을 가진 규영이에게 500만원을 이체한다고 해보자. 이 과정이 모두 끝난 상황에 홍철은 500만원, 규영이는 500만원을 가진다. 이 작업을 취소한다고 했을 때에 홍철이는 다시 1000만원, 규영이는 0원이 된다. 그래서 all or nothing 이다.

커밋과 롤백

커밋은 여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어이다. 트랜잭션 단위로 수행되며 변경된 내용이 모두 영구적으로 저장되는 것을 말한다. 커밋을 할 때에는 update, insert, delete의 쿼리가 하나의 트랜잭션 단위로 수행되고 이후에 데이터베이스에 영구 저장된다.

에러나 여러 이슈 때문에 트랜잭션 전으로 돌려야 한다면 사용되는 것이 롤백이다. 롤백은 트랜잭션으로 처리한 하나의 묶음 과정을 일어나기 전으로 돌리는 일을 말한다.

트랜잭션 전파

트랜잭션을 수행할 때 커넥션 단위로 수행하기 때문에 커넥션 객체를 넘겨서 수행해야 한다. 하지만 이를 매번 넘겨주기가 어렵기도 해서 이를 넘겨서 수행하지 않고 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것을 트랜잭션 전파라고 한다.

일관성

일관성은 허용된 방식으로만 데이터를 변경해야 하는 것을 의미한다. 데이터베이스에 기록된 모든 데이터는 여러 가지 조건, 규칙에 따라 유효함을 가져야 한다. 예를 들어 홍철이는 1000만원이 있고 범석이는 0원이 있을 때, 범석이가 500만원을 입금하는 것은 불가능하다.

격리성

격리성은 트랜잭션 수행 시에 서로 끼어들지 못하는 것을 말한다. 복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 하고, 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 한다. 순차적으로 하면 쉽지만 성능이 나빠지기 때문이다.

위로 갈수록 동시성이 강해지만 격리성은 약해지고, 아래로 갈수록 동시성은 약해지지만 격리성은 강해진다.

격리 수준에 따라 발생하는 현상

격리 수준에 따라 발생하는 현상은 팬텀 리드, 반복 가능하지 않은 조회, 더티 리드가 있다.

  • 팬텀 리드:
    한 트랜잭션 내에서 동일한 쿼리를 보냈을 때 해당 조회 결과가 다른 경우를 의미한다. 예를 들어 A가 회원 테이블에서 age 12 이상인 회원들을 조회하는 쿼리를 보냈을 때 세 개의 테이블이 조회한다고 가정하면 B가 age 15인 회원을 삽입했을 때 3개가 아닌 4개의 테이블이 조회된다.

  • 반복 가능하지 않은 조회:
    한 트랜잭션 내의 같은 행에 두번 이상 조회가 발생했는데, 그 값이 다른 경우를 가리킨다. 예를 들어 A가 큰돌의 보석 개수가 100개라는 값을 가진 데이터였는데, 그 이후 B가 그 값을 1로 변경해서 커밋했다면 A는 100이 아닌 1을 읽게 된다.

  • 더티 리드
    반복 가능하지 않은 조회와 유사하며 한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 아직 '커밋되지 않은' 행의 데이터를 읽을 수 있을 때 발생한다. 예를 들어 A가 큰돌의 보석 개수 100을 1로 변경한 내용이 '커밋 되지 않은' 상태라도 그 이후 사용자 B가 조회한 결과가 1로 나오는 경우를 말한다.

격리 수준

  • SERUALIZABLE
    트랜잭션을 순차적으로 진행시키는 것을 말한다. 여러 트랜잭션이 동시에 같은 행에 접근할 수 없다. 이 수준은 매우 엄격한 수준으로 해당 행에 대해 격리시킨다.

  • REPEATABLE_READ
    하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않는다. 따라서 이후에 추가된 행이 발견될 수 있다.

  • READ_COMMITTED
    가장 많이 사용되는 격리 수준이며 다른 트랜잭션이 커밋하지 않은 정보는 읽을 수 없다. 즉 커밋 완료된 데이터에 대해서만 조회를 허용한다.

  • READ_UNCOMMITTED
    가장 낮은 격리 수준으로, 하나의 트랜잭션이 커밋되기 이전에 다른 트랜잭션에 노출되는 문제가 있지만 가장 빠르다. 이는 데이터 무결성을 위해 되도록이면 사용하지 않는 것이 이상적이다.

지속성

지속성은 성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미한다. 이는 데이터베이스에 시스템 장애가 발생하더라도 원래 상태로 복구하는 회복 기능이 있어야 함을 의미한다.

무결성

무결성이란 데이터의 정확성, 일관성, 유효성을 유지하는 것을 말한다. 무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는 지에 대한 신뢰가 생긴다. 무결성의 종류는 개체 무결성, 참조 무결성, 고유 무결성, NULL 무결성이 있다.

profile
블로그 이전했습니다

0개의 댓글