영속성 컨텍스트

박진선·2022년 11월 20일
0

영속성 컨텍스트란?

  • 엔티티(Entity)를 저장하고 관리하는 저장소의 개념 이다.

  • Entity Manager Factory에서 디비에 접근하는 트랜잭션이 생길 때 마다 쓰레드 별로 Entity Manager를 생성하여 영속성 컨텍스트에 접근한다.

  • EntityManager에 엔티티를 저장하거나 조회하면 EntityManager는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.
    (EntityManager가 생성되면 논리적 개념인 영속성 컨텍스트(PersistenceContext)가 1:1로 생성된다)

영속성 컨텍스트 특징

  • 영속성 컨텍스트는 엔티티를 식별자 값(@Id 를 사용하여 테이블의 기본 키(PK)와 매핑한 값)으로 구분한다. 따라서 영속 상태가 되기 위해서는 반드시 식별자가 존재해야 한다.

  • JPA는 보통 트랜잭션을 커밋하는 순간 영속성 컨텍스트에 새로 저장된 엔티티를 데이터 베이스에 반영하는데 이를 flush라 한다.

  • 영속성 컨텍스트가 엔티티를 관리하는 것의 장점
    1차 캐시
    동일성 보장
    트랜잭션을 지원하는 쓰기 지연
    변경 감지
    지연 로딩

영속성 컨텍스트의 기능

1. 1차, 2차 캐시

  • 네트워크를 통해 데이터베이스에 접근하는 시간 비용은 애플리케이션 서버에서 내부 메모리에 접근하는 시간 비용보다 비싸다. 따라서 조회한 데이터를 메모리에 캐시 해서 데이터베이스 접근 횟수를 줄이면 애플리케이션 성능을 획기적으로 개선할 수 있다.

  • 영속성 컨텍스트 내부에는 엔티티를 보관하는 저장소가 있는데 이것을 1차 캐시라 한다. 영속 상태의 엔티티를 이곳에 저장한다.
    일반적인 웹 애플리케이션 환경은 트랜잭션을 시작하고 종료할 때까지만 1차 캐시가 유효하다. 따라서 애플리케이션 전체로 보면 데이터베이스 접근 횟수를 획기적으로 줄이지는 못한다.
    이것을 보완하기 위해 하이버네이트를 포함한 대부분의 JPA 구현체들은 애플리케이션 범위의 캐시를 지원하는데 이것을 공유 캐시 또는 2차 캐시라 한다.

  • 일반적으로 JPA는 스프링 프레임워크 같은 컨테이너 위에서 실행하면 컨텍스트는 트랜잭션과 생명주기를 같이한다. 즉 같이 생성되고 종료된다. 트랜잭션을 커밋하거나 플러시를 호출하면 1차 캐시에 있는 엔티티의 변경 내역을 데이터베이스에 동기화한다.

  • 1차 캐시는 Map의 형태로 만들어지며 Key는 식별자 값(데이터베이스의 기본 키)이고 Value는 엔티티 인스턴스이다.
    엔티티 매니저로 조회하거나 변경하는 모든 엔티티는 1차 캐시에 저장된다.
    요청(스레드) 하나당 엔티티 매니저가 하나씩 생성 되기에 영속 컨텍스트도 하나씩 생성되고 당연히 1차 캐시도 스레드당 하나만 생성된다. 다른 스레드와 공유하지 않는다.

아래 코드를 참고하자

  • @Entity 어노테이션을 갖는 엔티티 인스턴스를 막 생성했을 때는 영속성 컨텍스트에서 관리하지 않는다. (비영속 상태)

  • em.persist() 메소드를 통해 member가 영속성 컨텍스트(1차 캐시)에 저장된다 영속상태로 변경된다. 영속성 컨텍스트를 1차 캐시라 이해해도 무방하다. (영속 상태)

em.find() 메소드를 실행하여 조회시 흐름은 다음과 같다

  • "member2"조회 요청 시 JPA는 영속성 컨텍스트의 1차 캐시에서 해당 PK값을 가진 Member객체를 찾는다.
  • 1차 캐시에 존재한다면 그 값을 반환하고, 존재하지 않는다면 DB를 조회하여 값을 가져온다.
  • DB를 조회하여 값을 가져온 경우라면, 가져온 값을 1차 캐시에 저장 한다.
  • 1차 캐시에 저장 후 "member2"을 조회하면, DB를 거치지 않고 1차 캐시에서 가져온다.
  • 위에 이미지처럼 find를 했을 때 해당 엔티티가 1차 캐시에 존재하면 1차 캐시에 저장된 엔티티를 반환하고 존재하지 않으면 DB를 조회한다. 하지만 동일한 트랜잭션 내에서만 1차 캐시가 존재하기 때문에 이미 1차 캐시에 저장되어 있는 경우는 흔치 않다.
//엔티티를 생성한 상태 (비영속)
Member member = new Member();
member.setId("member1");
member.serUsername("회원1");

// Member엔티티를 영속화, 1차 캐시에 저장됨
EntityManagerFactory emf = Persistence.createEntityManagerFactory("JpaExample"); // EntityManagerFactory 생성
EntityManager em = emf.createEntityManager(); // EntityManager 생성
em.persist(member); // 1차 캐시에 저장됨

//1차 캐시에서 조회
Member findMember = em.find(Member.class, "member1");

참고사항

  • 엔티티 매니저는 보통 데이터베이스 트랜잭션 단위로 생성하고, 트랜잭션이 끝나는 시점에 종료시킨다. 엔티티 매니저가 종료되면 엔티티 매니저의 1차 캐시에 존재하는 데이터들도 모두 지워지고 트랜잭션은 길게 발생하지 않는다, 트랜잭션 굉장히 짧은 찰나의 순간에만 존재하기 때문에 1차캐시를 통해서 그렇게 큰 성능 이점을 얻기는 힘들다.

2. 영속 엔티티의 동일성 보장

  • JPA는 하나의 트랜잭션 안에 존재하는(= 1차 캐시 내에 존재하는) Id(식별자 값)가 같은 엔티티에 대해서 동일성을 보장해준다.
  • 1차 캐시로 반복 가능한 읽기(REPEATABLE READ) 등급의 트랜잭션 격리 수준을 데이터베이스가 아닌 애플리케이션 차원에서 제공한다.
//Id가 1인 Member 엔티티 조회
Member findMember1 = em.find(Member.class, 1L);
Member findMember2 = em.find(Member.class, 1L);

System.out.println(findMember1 == findMember2);//true가 반환

3. 엔티티 등록 시 쓰기 지연

  • 영속성 컨텍스트에는 1차캐시 말고도 '쓰기 지연 SQL 저장소'가 존재한다.

  • 아래 코드에서 em.persist() 메소드를 호출하면 INSERT SQL이 생성되어 "쓰기 지연 SQL 저장소"에 저장된다. 이렇게 계속 변경이 일어나면 SQL을 생성하여 쓰기 지연 SQL 저장소에 저장했다가, 트랜잭션을 commit 할때 한번에 DB에 전송한다.

  • spring.jpa.properties.hibernate.jdbc.batch_size= 해당 옵션을 통해 한꺼번에 INSERT/UPDATE를 실행할 크기(쓰기 지연 SQL 저장소 저장할 SQL의 최대 개수)를 지정할 수 있다.

EntityTransaction transaction = em.getTransaction();

//엔티티 변경은 항상 트랜잭션 속에서 이루어져야 한다.
transaction.begin():

em.persist(memberA);
em.persist(memberB);
//여기까지 INSERT SQL을 데이터베이스에 전송하지 않는다.


//트랜잭션을 커밋하는 순간 데이터베이스에 INSERT SQL을 보낸다
transaction.commit();

4. 변경 감지(Dirty Checking)

  • JPA는 1차 캐시에 들어있는 엔티티가 변경된다면, 그 변경된 내용을 감지하여,트랜잭션 커밋 시점에 변경된 내용을 DB에 반영한다. 이것이 변경감지 이다. 변경 감지는 영속성 컨텍스트가 관리하는 영속 상태의 엔티티만 적용된다.

  • JPA로 엔티티를 수정할 때는 단순히 엔티티를 조회해서 데이터를 변경하기만 하면 된다.

변경 감지의 원리

  • 1차 캐시에는 @Id와 Entity 말고도 '스냅샷' 이라는 컬럼이 존재한다. 엔티티가 1차 캐시에 저장될 때, 저장되는 시점의 상태를 스냅샷으로 만들어 1차 캐시에 보관한다. 트랜잭션이 커밋되는 시점에 엔티티와 스냅샷을 비교하는데, 이때 만약 엔티티가 변경되었다면 스냅샷과 차이가 있을 것이고, JPA는 이를 감지하여 DB에 반영한다. 커밋되는 시점에 엔티티와 스냅샷을 비교 하기 때문에 엔티티를 수정하였다가 커밋시점 이전에 복구 시키면 update 쿼리가 실행되지 않는다.

5. 플러시(flush)

  • 영속성 컨텍스트의 변경 내용을 DB에 반영한다.

  • 트랜잭션 커밋이 일어날 때 플러시가 동작하는데, 쓰기 지연 저장소에 쌓아 놨던 INSERT, UPDATE, DELETE SQL들이 데이터베이스에 날라간다

  • 플러시의 흐름
    변경 감지가 동작해서 스냅샷과 비교해서 수정된 엔티티를 찾는다.
    수정된 엔티티에 대해서 수정 쿼리를 만들고 쓰기 지연 SQL 저장소에 등록한다.
    쓰기 지연 SQL 저장소의 쿼리를 데이터베이스에 전송한다.
    플러시가 발생한다고 커밋이 이루어지는게 아니고 플러시 다음에 커밋이 일어난다 아래 내용을 참고하자.

영속성 컨텍스트를 flush 하는 방법

  • em.flush() : 엔티티 매니저의 flush() 메서드로 영속성 컨텍스트를 강제로 플러시한다.

  • 트랜잭션만 커밋하면 DB에 반영되지 않는다. 따라서 트랜잭션을 커밋하기 전에 꼭 플러시를 호출해서 영속성 컨텍스트의 변경 내용을 DB에 반영해야 한다. JPA는 이런 문제를 예방하기 위해 트랜잭션을 커밋할 때 플러시를 자동으로 호출한다.

  • JPQL 쿼리를 실행하면 자동으로 flush를 호출한다.

em.persist(memberA);
em.persist(memberB);
em.persist(memberC);

// JPQL 실행
query = em.createQuery("select m from Member m", Member.class);
List<Member> members = query.getResultList();

엔티티의 생명 주기

비영속(new/transient)

  • 순수한 객체 상태이며, 영속성 컨텍스트와 관련이 없는 상태

영속(managed)

  • EntityManager를 통해 엔티티를 영속성 컨텍스트에 저장되어 영속성 컨텍스트가 관리하는 상태
    em.persist() 메소드를 호출하여 인자로 Entity를 넘겨준 상태, em.find()나 JPQL를 사용해서 조회한 엔티티도 영속 상태이다.

준영속(detached)

  • 영속성 컨텍스트에 저장되었다가 분리된(detached) 상태

  • 영속 상태의 엔티티가 분리된 상태이기 때문에 Dirty Checking이나 변경 감지 등의 영속성 컨텍스트가 제공하는 기능을 사용할 수 없다.

특징

  • 거의 비영속 상태와 동일
    영속성 컨텍스트가 관리하지 않기 때문에 제공하는 어떤 기능도 동작하지 않음

  • 식별값을 보유
    비영속 상태는 식별값이 없을 수 있지만 준영속 상태는 영속상태였기 때문에 반드시 식별자를 보유하고 있다

  • 지연 로딩 불가
    지연 로딩(LAZY LOADING)은 실제 객체 대신 프록시 객체를 로딩하고 해당 객체를 실제 사용시 영속성 컨텍스트를 통해 데이터를 불러옴, 하지만 더이상 영속성 컨텍스트가 관리하지 않기 때문에 지연 로딩시 문제가 발생

준영속 상태로 변경하는 메소드

  • detach() : 특정 엔티티를 준영속 상태로 만듬, 더이상 엔티티를 관리 하지 않고 1차 캐시, 쓰기지연 SQL 저장소에서 해당 엔티티를 관리하기 위한 모든 정보가 삭제한다.
  • clear() : 영속성 컨텍스트를 초기화해 해당 영속성 컨텍스트에 존재하는 모든 엔티티를 준영속 상태로 만든다, 모든 것이 초기화되었기 때문에 새로 만든 영속성 컨텍스트 상태와 동일하다 때문에 같은 Entity를 조회할 때 SELECT 쿼리가 발생하게 된다. 1차 캐시에 관계 없는 쿼리를 확인하고 싶을 때 유용하다.
  • close() : 영속성 컨텍스트를 종료하고 관리하던 모든 엔티티가 준영속 상태가 된다.

준영속 상태를 영속상태로 변경하는 메소드

  • merge() : 준영속 상태의 엔티티를 다시 영속상태로 변환한다. 준영속 상태의 엔티티를 받아 가지고 있는 정보로 새 영속 상태의 엔티티를 반환한다. 영속 상태의 엔티티도 영속 상태로 만들 수 있다. 파라미터로 넘어온 엔티티의 식별자 값으로 영속성 컨텍스트를 조회하고 찾는 엔티티가 없으면 데이터베이스에서 조회하고 영속 상태로 만든다. 만약 데이터베이스에서도 없으면 새로운 엔티티를 생성한다. 만약 불러온 엔티티와 파라미터로 넘긴 객체와 값이 다를 경우 값을 채우고 병합이 이루어진다. 따라서, 병합은 save or update를 수행한다.

삭제(removed)

  • 엔티티를 영속성 컨텍스트와 데이터베이스에서 삭제한 상태

EntityManagerFactory

  • 엔티티 매니저 팩토리는 생성되는 시점에 DB 커넥션 풀을 생성해 둔 후, 고객의 요청이 들어올 때마다 엔티티 매니저를 생성한다. 엔티티 매니저는 DB 연결이 필요한 시점(보통 트랜잭션이 시작되는 경우)에 커넥션 풀에 있는 connection을 얻는다

엔티티 매니저 팩토리가 엔티티 매니저를 사용하는 이유

  • EntityManagerFactory는 생성되는 시점에 DB 커넥션 풀을 생성하기에 생성 비용이 매우 크다 그러나 EntityManager의 생성 비용은 거의 들지 않으므로,필요에 따라 EntityManager를 생성하여 사용한다.
  • 엔티티 매니저 팩토리는 스레드 세이프(Thread Safe)하다 하지만 EntityManager는 Thread Not Safe 하기 때문에 여러 스레드가 동시에 접근하면 동시성 문제가 발생한다. 따라서, 요청(스레드)별로 한 개 씩 할당한다. SpringContainer 는 EntityManager 객체를 사용할 때, proxy 패턴을 이용하여 주입해줌으로서 Thread Safe 를 보장해준다.
profile
주니어 개발자 입니다

0개의 댓글