1. 엔티티 매니저 팩토리와 앤티티 매니저
1.1. 엔티티 매니저
- 엔티티를 저장하고, 수정하고, 삭제하고, 조회하는 등 엔티티와 관련된 모든 일을 처리한다.
- 엔티티 매니저 팩토리에서 생성되며, 생성하는 비용이 거의 들지 않는다.
- 스레드 안전하지 않다.
따라서 하나의 엔티티 매니저에 여러 스레드가 동시에 접근할 경우 동시성 문제가 발생하므로 스레드 간 공유할 수 없다.
- 데이터베이스 연결이 꼭 필요한 시점(ex. 트랜잭션이 시작된 경우)이 되기 전까지는 데이터베이스와의 커넥션을 획득하지 않는다.
1.2. 엔티티 매니저 팩토리
- 엔티티 매니저를 생성하는 공장이다.
- 생성하는 비용이 상당히 크다.
따라서, 일반적으로 하나의 엔티티 매니저 팩토리만을 생성하여 애플리케이션 전체에서 공유하도록 설계되어 있다.
- 스레드 안전하다.
즉, 하나의 엔티티 매니저 팩토리에 여러 스레드가 동시에 접근해도 문제가 없다.
2. 영속성 컨텍스트(Persistence Context)
개념
- 엔티티를 영구 저장하는 환경이라는 뜻이다.
- 일반적으로 엔티티 매니저를 생성할 때 하나가 만들어진다.
- 엔티티 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.
- 엔티티 매니저를 통해 영속성 컨텍스트에 접근할 수 있고, 영속성 컨텍스트를 관리할 수 있다.
2.1. 특징
2.1.1. 식별자 값을 통한 구분
영속성 컨텍스트는 엔티티를 식별자 값(@Id로 테이블의 기본 키와 매핑한 값)으로 구분한다.
따라서 영속 상태의 엔티티는 반드시 식별자 값을 가져야 한다. 엔티티에 식별자 값이 없으면 예외가 발생한다.
2.1.2. 1차 캐시
- 영속성 컨텍스트가 내부에 가지고 있는 캐시이다.
- 영속 상태의 엔티티가 모두 이곳에 저장된다.
- key(식별자 값)-value(엔티티 인스턴스) 형태로 저장된다.
식별자 값은 데이터베이스의 기본 키와 매핑되어 있기 때문에 기본 키는 영속성 컨텍스트에 데이터를 저장하고 조회하는 기준이 된다.
2.1.3. 트랜잭션을 지원하는 쓰기 지연(transactional write-behind)
엔티티 매니저는 트랜잭션을 커밋하기 직전까지 데이터베이스에 엔티티를 저장하지 않고 내부 쿼리 저장소(쓰기 지연 SQL 저장소)에 SQL을 차곡차곡 모아둔다. 그리고 트랜잭션을 커밋할 때 모아둔 쿼리를 데이터베이스에 보낸다(flush). 이것을 트랜잭션을 지원하는 쓰기 지연이라고 한다.
데이터베이스의 트랜잭션이라는 작업 단위가 이 쓰기 지연을 가능하게 한다. 커밋 시점에 쿼리 내용을 반영하기 때문에, 트랜잭션 커밋 직전에만 변경 내용을 데이터베이스에 보내 동기화하면 되는 것이다.
2.1.4. 변경 감지(dirty checking)
JPA에서는 엔티티의 변경 사항이 있을 경우 별도의 처리 없이도 데이터베이스에 자동으로 반영된다.
따라서 엔티티를 수정할 때 SQL 수정 쿼리를 작성할 필요 없이 단순히 엔티티를 조회한 후 데이터를 변경하기만 하면 된다.
변경 감지는 영속 상태의 엔티티에만 적용된다.
자세한 엔티티 수정 과정은 하단 동작 과정에 작성해 두었다.
- 스냅샷
JPA는 엔티티를 영속성 컨텍스트에 보관할 때 최초 상태를 복사해서 저장해두는데, 이것을 스냅샷이라고 한다.
플러시 시점에 스냅샷과 현재 엔티티의 상태를 비교함으로써 엔티티의 변경 여부를 감지한다.
2.2. 플러시(flush)
영속성 컨텍스트에 새로 저장된 엔티티는 트랜잭션을 커밋하는 순간에 데이터베이스에 반영된다. 이렇게 영속성 컨텍스트의 변경 내용을 데이터베이스에 동기화하는 작업을 플러시(flush)라고 한다.
2.2.1. 플러시 동작 과정
- 변경 감지가 동작해서 영속성 컨텍스트에 있는 모든 엔티티를 스냅샷과 비교하여 수정된 엔티티를 찾는다.
- 수정된 엔티티에 대한 수정 쿼리를 생성한 후 쓰기 지연 SQL 저장소에 등록한다.
- 쓰기 지연 SQL 저장소의 등록, 수정, 삭제 쿼리를 데이터베이스에 전송한다.
2.2.2. 영속성 컨텍스트 플러시 방법
- 직접 호출
em.flush()를 직접 호출하여 강제로 플러시한다. 사용할 일이 거의 없다.
- 트랜잭션 커밋을 통한 플러시 자동 호출
JPA는 영속성 컨텍스트의 변경 내용이 데이터베이스에 반영되지 않는 문제를 예방하기 위해 트랜잭션을 커밋할 때 플러시를 자동으로 호출한다.
- JPQL 쿼리 실행을 통한 플러시 자동 호출
작성된 JPQL을 실행하면 JPQL은 SQL로 변환되어 데이터베이스에서 엔티티를 조회한다. 그런데 영속성 컨텍스트가 플러시되기 전이라면 아직 변경 내용이 데이터베이스에 반영되지 않은 상태이기에 조회가 되지 않을 것이다. 이러한 문제를 예방하기 위해 JPA는 JPQL을 실행하기 전 플러시를 자동으로 호출한다.
2.2.3. 주의점
em.find() 메서드를 호출할 때는 플러시가 실행되지 않는다.
- 플러시는 영속성 컨텍스트에 보관된 엔티티를 삭제하는 것이 아니다.
3. 엔티티의 생명주기
3.1. 비영속(new/transient)
엔티티 객체를 생성한 후 em.persist()를 호출하기 전, 순수한 객체 상태이다.
즉, 아직 데이터베이스에 저장되지 않았으며 영속성 컨텍스트와도 관계가 없는 상태이다.
3.2. 영속(managed)
em.persist()를 호출함으로써 엔티티 매니저를 통해 영속성 컨텍스트에 저장된 엔티티가 영속성 컨텍스트에 의해 관리되고 있는 상태이다.
영속 상태에 있는 엔티티는 em.find()나 JPQL을 통해서 조회된다.
3.2.1. 비영속/준영속 상태의 엔티티를 영속 상태로 변경
비영속/준영속 상태의 엔티티를 영속 상태로 변경하려면 병합을 사용하면 된다.
merge(entity) 메서드를 호출하면 병합이 수행된다.
동작 과정은 다음과 같다.
1. merge()를 실행한다.
2. 파라미터로 넘어온 준영속 엔티티의 식별자 값으로 1차 캐시에서 엔티티를 조회한다.
3. 만약 1차 캐시에 엔티티가 없으면 데이터베이스에서 엔티티를 조회하고 1차 캐시에 저장한다.
4. 조회한 영속 상태의 엔티티에 파라미터로 받은 엔티티의 값을 채워 넣는다.
5. 영속 상태의 엔티티를 반환한다.
결과적으로 merge()는 다음과 같이 save or update 기능을 수행하게 된다.
1. 파라미터로 받은 엔티티가 영속 상태라면
해당 엔티티의 값을 파라미터로 받은 엔티티의 값으로 변경(병합)한다.
2. 파라미터로 받은 엔티티가 비영속/준영속 상태라면
파라미터로 받은 비영속/준영속 상태의 엔티티 정보를 가지고 새로운 영속 상태의 엔티티를 생성해 반환한다.
3.3. 준영속(detached)
영속성 컨텍스트가 관리하던 영속 상태의 엔티티가 영속성 컨텍스트에서 분리되어 더 이상 영속성 컨텍스트가 관리하지 않게 된 상태이다.
3.3.1. 영속 상태의 엔티티를 준영속 상태로 만드는 방법
- em.detach(entity)
특정 entity를 영속성 컨텍스트에서 분리해 준영속 상태로 만든다.
이 메서드를 호출하는 순간 1차 캐시부터 쓰기 지연 SQL 저장소까지 영속성 컨텍스트에서 해당 엔티티를 관리하기 위해 존재하던 모든 정보가 제거된다.
- em.close()
영속성 컨텍스트를 닫는다(종료한다).
영속성 컨텍스트가 관리하던 모든 영속 상태의 엔티티가 준영속 상태가 된다.
- em.clear()
영속성 컨텍스트를 초기화한다.
영속성 컨텍스트가 관리하던 모든 영속 상태의 엔티티가 준영속 상태가 된다.
3.3.2. 준영속 상태인 엔티티의 특징
- 거의 비영속 상태에 가깝다.
준영속 상태의 엔티티는 영속성 컨텍스트가 제공하는 기능을 사용할 수 없다.
특히, 엔티티의 변경 사항 또한 감지되지 않기 때문에 변경 사항이 데이터베이스에 반영되지 않는다.
- 식별자 값을 가지고 있다.
이전에는 영속 상태였기 때문이다.
- 지연 로딩(Lazy Loading)을 할 수 없다.
지연 로딩은 실제 객체 대신 프록시 객체를 로딩해두었다가, 해당 객체를 실제로 사용할 때 영속성 컨텍스트에서 데이터를 불러오는 방법이다. 하지만 준영속 상태의 엔티티는 영속성 컨텍스트가 더는 관리하지 않으므로 지연로딩이 불가하다.
3.4. 삭제(removed)
엔티티를 영속성 컨텍스트와 데이터베이스에서 삭제한 상태이다.
em.remove()를 호출함으로써 가능하다.
4. 동작 과정
4.1. 엔티티 조회
4.1.1. 과정
em.find()를 호출한다.
- 영속성 컨텍스트의 1차 캐시에서 식별자 값으로 엔티티를 찾는다.
- 영속성 컨텍스트에 찾는 엔티티가 있다면?
: 데이터베이스를 조회하지 않고 메모리에 있는 1차 캐시에서 해당 엔티티를 조회한다.
영속성 컨텍스트에 찾는 엔티티가 없다면?
: 엔티티 매니저는 데이터베이스를 조회해서 엔티티를 생성하고, 해당 엔티티를 1차 캐시에 저장한 후 영속 상태의 엔티티를 반환한다.
4.1.2. 엔티티 조회 시 1차 캐시를 이용함으로써 얻는 이점
1차 캐시에 저장되어 있는 영속 상태의 엔티티의 경우 데이터베이스를 거치지 않고 바로 반환된다.
이를 통해 다음과 같은 이점을 누릴 수 있다.
- 성능
엔티티를 1차 캐시에 저장해 두고 바로 불러오면 데이터베이스를 조회할 필요가 없기에 성능상 이점을 누릴 수 있다.
- 엔티티의 동일성 보장
동일한 엔티티에 대해 em.find(Entity.class, "entity1")를 반복해서 호출하더라도 영속성 컨텍스트는 1차 캐시에 있는 같은 엔티티 인스턴스를 반환한다. 따라서 동일한 엔티티에 대한 동일성 비교, 즉 참조 비교가 성공한다.
4.2. 엔티티 등록
4.2.1. 과정
em.persist(entity)가 호출된다.
- 영속성 컨텍스트는 1차 캐시에 entity를 저장하면서 동시에 등록 쿼리를 만든다.
- 만들어진 등록 쿼리를 쓰기 지연 SQL 저장소에 보관한다.
em.persist()가 호출될 때마다 2, 3번 과정이 반복되며 등록 쿼리가 쌓인다.
transaction.commit()이 호출되면 트랜잭션이 커밋된다.
- 엔티티 매니저는 영속성 컨텍스트를 플러시한다.
이때 쓰기 지연 SQL 저장소에 모인 쿼리를 데이터베이스에 보내 변경 내용을 데이터베이스에 한꺼번에 동기화한다.
- 실제 데이터베이스 트랜잭션을 커밋한다.
4.3. 엔티티 수정
4.3.1. 과정
transaction.commit()이 호출되면 트랜잭션이 커밋된다.
- 엔티티 매니저 내부에서
flush()가 호출된다.
- 엔티티와 스냅샷을 비교해서 변경된 엔티티를 찾는다.
- 변경된 엔티티가 있으면 UPDATE 쿼리를 생성해서 쓰기 지연 SQL 저장소에 저장한다.
- 쓰기 지연 저장소의 SQL을 데이터베이스에 보낸다.
- 데이터베이스 트랜잭션을 커밋한다.
4.3.2. JPA가 생성 및 실행하는 UPDATE 쿼리의 특징
JPA는 기본적으로 UPDATE 쿼리 생성 시 수정된 특정 필드에 대해서만 값을 변경하지 않고, 엔티티의 모든 필드를 업데이트하도록 쿼리를 생성한다. 이렇게 하면 데이터베이스에 보내는 데이터 전송량이 증가한다는 단점이 있지만, 수정 쿼리가 항상 동일하기 때문에 다음과 같은 이점을 누릴 수 있다.
- 애플리케이션 로딩 시점에 UPDATE 쿼리를 미리 생성해두고 재사용하는 것이 가능하다.
- 데이터베이스에 동일한 쿼리를 보내면 데이터베이스는 이전에 파싱된 쿼리를 재사용할 수 있다.
4.4. 엔티티 삭제
4.4.1. 과정
em.find()를 호출해 삭제하고자 하는 엔티티를 조회한다.
em.remove()를 호출하고, 앞서 조회한 삭제 대상 엔티티를 파라미터로 넘겨준다.
- 삭제 쿼리를 쓰기 지연 SQL 저장소에 저장한다.
transaction.commit()이 호출되면 트랜잭션이 커밋된다.
- 엔티티 매니저 내부에서
flush()가 호출된다.
- 쓰기 지연 저장소의 SQL을 데이터베이스에 보낸다.
- 데이터베이스 트랜잭션이 커밋되며 데이터베이스에 전달된 삭제 쿼리가 실행된다.
삭제된 엔티티는 재사용하지 않고 자연스럽게 가비지 컬렉션의 대상이 되도록 두는 것이 좋다.