[SpringBoot] JPA 영속성 컨텍스트

나른한 개발자·2026년 1월 13일

f-lab

목록 보기

25/44

JPA 영속성 컨텍스트

영속성 컨텍스트란 엔티티를 영구 저장하는 환경이다. 엔티티 매니저로 엔티티를 저장하거나 조회하면 엔티티 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.

em.persist()는 엔티티를 저장하는 것이지만 사실 엔티티 매니저를 사용해서 회원 엔티티를 영속성 컨텍스트에 저장한다.

엔티티 매니저(EntityManager)로 엔티티를 저장하거나 조회하면 엔티티 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리할 수 있게 된다. 일반적으로 엔티티 매니저는 사용자의 요청 당 1개가 생성되며, 각 엔티티 매니저마다 영속성 컨텍스트 1개가 만들어진다. 때문에 영속성 컨텍스트에 저장된 엔티티에 접근하기 위해서는 반드시 엔티티 매니저를 통해야 한다. 참고로 스프링과 함께 사용하면 여러 개의 엔티티 매니저가 하나의 영속성 컨텍스트에 매핑된다.

엔티티의 생명주기

엔티티에는 4가지 상태가 존재한다.

비영속: 영속성 컨텍스트와 전혀 관계가 없는 상태
영속: 영속성 컨텍스트에 저장된 상태
준영속: 영속성 컨텍스트에 저장되었다가 분리된 상태
삭제: 삭제된 상태

비영속 (new/transient)

Member member = new Member();
member.setId("member1");
member.setUsername("name);

엔티티 객체를 생성한 후 저장하지 않은 상태이다. 순수한 객체 상태로, 영속성 컨텍스트나 데이터베이스와는 전혀 관련이 없다. 이 상태를 비영속 상태라고 한다.

영속(managed)

em.persist(member);

엔티티 매니저를 통해서 엔티티를 영속성 컨텍스트에 저장했다. 이렇게 영속성 컨텍스트가 관리하는 엔티티를 영속 상태라고 한다. 이제 회원 엔티티는 영속 성태가 되었다. 즉 영속 상태라는 것은 영속성 컨텍스트에 의해 관리된다는 뜻과 같다.

이때 영속성 컨텍스트는 엔티티를 식별자 값으로 구분한다. 만약 식별자 값이 없으면 예외가 발생한다. 여기서 식별자 값이란 @Id 애노테이션이 붙은 필드로 테이블의 기본키와 매핑한 값을 말한다.

준영속(detached)

영속성 컨텍스트가 관리하던 영속 상태의 엔티티를 영속성 컨텍스트가 관리하지 않으면 준영속 상태가 된다. 준영속 상태로 만드는 방법은 3가지가 있다.

em.detach(member); // member를 영속성 컨텍스트에서 분리
em.clear(); // 영속성 컨텍스트를 초기화
em.close(); // 영속성 컨텍스트를 종료

삭제 (removed)

em.remove(member);

영속성 컨텍스트와 데이터 베이스에서 엔티티를 삭제한다.

영속성 컨텍스트의 이점

엔티티들을 데이터베이스에 바로 반영하지 않고 굳이 영속성 컨텍스트라는 공간에서 관리하는 이유가 있다.

1차 캐시
동일성 보장
트랜잭션을 지원하는 쓰기 지연
변경 감지(Dirty Checking)
지연 로딩

1차 캐시

영속성 컨텍스트는 내부에 엔티티를 저장할 수 있는 캐시를 가지고 있는데 이를 1차 캐시라고 한다. 엔티티를 처음 영속성 컨텍스트에 저장하면(영속 상태로 만들면) 1차 캐시에 엔티티가 저장된다.

// 엔티티 객체 생성
Member member = new Member();
member.setId("member1");
member.setName("회원1");

em.persist(member);

그림처럼 키는 식별자 값(@Id)이고 값은 엔티티 인스턴스다. 만약 1차 캐시에 조회하려는 엔티티가 있다면, DB를 거치지 않고 메모리 상에서 바로 조회할 수 있다.
다음 코드를 실행해 보자.

Member member1 = em.find(Member.class, "member1");

그럼 먼저 1차 캐시에서 Member 클래스 중 @Id 값이 member1인 엔티티가 있는지 찾는다. 위 1차 캐시에 해당하는 엔티티가 있으므로 굳이 DB까지 거치지 않고 메모리에서 조회할 수 있다.
만약 1차 캐시에 없는 엔티티를 조회하면 어떻게 될까?

1. @Id 값이 member2인 Member 엔티티가 1차 캐시에 있는지 조회한다.
2. 1차 캐시에 없으므로 데이터베이스에서 조회한다.
3. 조회한 데이터로 엔티티를 생성해 영속성 컨텍스트의 1차 캐시에 저장한다.
4. 조회한 엔티티를 반환한다.

즉, 1차 캐시에 없는 엔티티는 데이터베이스에서 조회한 후, 새롭게 영속 상태로 만들어 관리한다. 이렇게 1차 캐시의 도움을 받으면, 데이터베이스에 접근해야 할 횟수를 줄일 수 있으므로 성능상 이점이 있다.

TIP
엔티티 매니저는 클라이언트의 요청이 오면 생성 됐다가 응답 후 자원을 반납하게 된다. 이는 마치 커텍션 풀에서 DB 커넥션을 사용 후 반납하는 것과 같은데, 클라이언트 요청 당 하나의 트랜잭션으로 처리한다는 컨셉을 맞추기 위함이다. 그런데 엔티티 매니저가 반납되면, 그 안에 있던 1차 캐시도 모두 지워진다. 때문에 사실 하나의 요청에 처리되는 비즈니스 로직이 여러 번의 엔티티를 조회하는 것처럼 복잡하지 않다면, 1차 캐시로 얻는 성능상 이점은 거의 없다.

동일성 보장

동일성(identity)은 실제 인스턴스(인스턴스 주소)가 같다는 의미로 참조 값을 비교하는 ==를 사용한다.

동등성(equality)은 실제 인스턴스가 가지고 있는 값이 같다는 의미로 equals() 메서드를 사용한다.

영속성 컨텍스트에서 관리되는 엔티티를 비교할 때, @Id 값이 같다면 1차 캐시에 있는 동일한 엔티티 인스턴스를 반환한다.

Member a = em.find(Member.class, "member1");
Member b = em.find(Member.class, "member1");

따라서 위 코드를 실행한 후, a == b를 해보면 true가 나온다. 만약 영속성 컨텍스트를 사용하지 않고 DB를 바로 거쳐 인스턴스를 생성했다면, 매번 새로운 인스턴스가 생성되어 동일성이 보장되지 않았을 것이다.

트랜잭션을 지원하는 쓰기 지연

엔티티 매니저가 관리하는 엔티티의 모든 변경은 트랜잭션 안에서 이루어 져야 한다.

EntityManager em = emf.createEntityManager();
EntityTransaction tx = em.getTransaction();
tx.begin();

em.persist(memberA);
em.persist(memberB);

tx.commit();

위 코드가 실행됐다고 했을 때, em.persist()를 호출한다고 해서 DB에 INSERT 쿼리를 날리지 않는다. 엔티티 매니저는 commit()이 호출되기 전까지는 내부 쿼리 저장소에 실행된 메서드에 해당하는 SQL들을 모아 둔다.

이것을 트랜잭션을 지원하는 쓰기 지연(transactional write-behind)이라 한다.
이렇게 쿼리 저장소에 모아둔 SQL들은 commit() 이 호출된 후 데이터베이스에 날린다. 이 과정이 영속성 컨텍스트의 변경 내용을 데이터베이스에 동기화하는 작업이다. 이때 데이터베이스에서도 커밋이 된다.

이 기능을 잘 활용하면 모아둔 쿼리를 데이터베이스에 한 번에 전달할 수 있으므로 성능을 최적화할 수 있다.

변경 감지(Dirty Checking)

JPA에서는 엔티티를 수정할 때 따로 update()같은 메서드가 필요 없다. 단지 영속성 컨텍스트 안의 엔티티를 수정하기만 하면, 엔티티의 변경사항을 데이터베이스에 자동으로 반영해 준다.
JPA는 엔티티를 영속성 컨텍스트에 보관할 때, 최초 상태를 복사해서 스냅샷으로 저장한다. 그러다 플러시(flush())가 호출되는 시점에 스냅샷과 엔티티를 비교해서 변경된 엔티티를 찾는다.

updat문 생성 시 JPA의 기본 전략은 엔티티의 모든 전략을 업데이트 한다. 모든 필드를 DB에 보내면 데이터 전송량이 증가하는 단점이 있지만 수정 쿼리가 항상 같아 애플리케이션 로딩 시점에 수정 쿼리를 미리 생성하여 재사용할 수 있다는 이점이 있다.

필드가 너무 많거나 저장되는 내용이 크면 수저된 데이터만 사용해서 동적으로 update문을 생성하는 하이버네이트 확장 기능을 사용할 수 있다.

@Entity
@org.hibernate.annotations.DynamicUpdate
@Talbe(name = "Member")
public class Memeber{...}

플러시 flush()

플러시(flush())는 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영하는 기능이다. 즉, 영속성 컨텍스트를 데이터베이스와 동기화하는 작업이라고 생각하면 된다.
플러시가 실행되면 아래와 같은 과정이 일어난다.

변경 감지가 동작해서 영속성 컨텍스트 안에 있는 모든 엔티티를 스냅샷과 비교한다.
수정된 엔티티가 있으면 수정 쿼리를 만들어 쓰기 지연 SQL 저장소에 등록한다.
이후 commit() 이 호출되면, 쓰기 지연 SQL 저장소의 모든 쿼리가 데이터베이스에 전송된다.

플러시를 호출하는 방법은 3가지다.

직접 호출 : 엔티티 매니저의 flush() 메서드를 직접 호출해서 영속성 컨텍스트를 강제로 플러시한다.
트랜잭션 커밋 시 플러시 자동 호출 : 트랜잭션이 커밋되기 전에 JPA는 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영하기 위해 플러시를 자동으로 호출한다.
JPQL 쿼리 실행 시 플러시 자동 호출 : 데이터베이스에 JPQL 쿼리를 직접 작성해서 날릴 때도 플러시가 자동 실행된다.

직접 호출

엔티티 매니저의 flush()를 직접 호출해서 영속성 컨텍스트를 강제로 플러시 한다. 테스트나 다른 프레임워크와 JPA를 함께 사용하는 경우를 제외하고 거의 사용하지 않는다.

트랜잭션 커밋시 플러시 자동 호출

데이터베이스에 변경 내용을 SQL로 전달하지 않고 트랜잭션만 커밋하면 어떤 데이터로 데이터베이스에 반영되지 않는다. 따라서 트랜잭션을 커밋하기 전에 꼭 플러시를 호출해서 영속성 컨텍스트의 변경 내용을 데이터 베이스에 반영해야한다. JPA는 이런 문제를 예방하기 위해 트랜잭션을 커밋할 때 플러시를 자동 호출한다.

JPQL 쿼리 실행 시 플러시 자동 호출

JPQL이나 Criteria 같은 객체 지향 쿼리를 호출해도 플러시가 호출된다.

em.persist(memberA);
em.persist(memberB);
em.persist(memberC);

query = em.createQuery("select m from Member m", Member.class);
List<Member> members = query.getResultList();

먼저 em.persist()를 호출해서 엔티티 memberA, memberB, memberC를 영속 상태로 만들었다. 이 엔티티들은 영속성 컨텍스트에는 있지만 아직 데이터베이스에는 반영되지 않았다. 이때 JPQL을 실행하면 어떻게 될까?

JPQL은 SQL로 변환되어 데이터베이스에서 엔티티를 조회한다. 그런데 memberA, memberB, memberC는 아직 데이터베이스에 없으므로 쿼리 결과로 조회되지 않는다. 따라서 쿼리를 실행하기 직전에 영속성 컨텍스트를 플러시해서 변경 내용을 데이터베이스에 반영해야한다. JPA는 이런 문제를 예방하기 위해 JPQL을 실행할 때도 플러시를 자동 호출한다. 따라서 memberA, memberB, memberC도 쿼리 결과에 포함된다.

참고로 식별자를 기준을 조회하는 find() 메서드를 호출할 때는 플러시가 실행되지 않는다.

트랜잭션 범위의 영속성 컨텍스트

스프링 컨테이너는 트랜잭션 범위의 영속성 컨텍스트 전략을 기본으로 사용한다. 이 전략은 이름 그대로 트랜잭션 범위와 영속성 컨텍스트의 생존 범위가 같다는 뜻이다. 즉 트랝개션ㅇ르 싲가할 때 영속성 컨텍스트를 생성하고 트랜잭션이 끝날 때 영송석 컨텍스트를 종료한다. 그리고 같은 트랝개션 안에서는 항상 같은 영소성 컨텍스트에 접근한다.

스프링 프레임워크를 사용하면 보통 비즈니스 로직을 시작하는 서비스 계층에 @Transactional 어노테이션을 선언하여 트랜잭션을 시작한다. 이 어노테이션이 있으면 호출한 메서드를 실행하기 직전에 스프링의 트랜잭션 AOP가 먼저 동작한다. 스프링 트랜잭션 AOP는 대상 메서드를 호출하기 직전에 트랜잭션ㅇ르 싲가하고, 대상 메서드가 정상종료되면 트랜잭션을 커밋하면서 종료한다.

이때 중요한 일이 일어나는데 트랜잭션을 커밋하면 JPA는 먼저 영속성 컨텍스트를 플러시해서 변경 내용을 데이터베이스에 반영한 후에 데이터 베이스 트랜잭션을 커밋한다. 따라서 영속성 컨텍스트의 변경 내용이 데이터베이스에 정상 반영된다. 만약 예외가 발생하면 트랜잭션을 롤백하고 종료하는데 이때는 플러시를 호출하지 않는다.

트랜잭션이 같으면 같은 영속성 컨텍스트를 사용한다.

트랜잭션 범위의 영속성 컨텍스트 전략은 다양한 위치에서 엔티티 매니저를 주입받아 사용해도 트랜잭션이 같으면 항상 같은 영속성 컨텍스트를 사용한다. 그럼 반대로 트랜잭션이 다르면 어떻게 될까?

트랜잭션이 다르면 다른 영속성 컨텍스트를 사용한다.

반대로 당연히 트랜잭션이 다르면 다른 영속성 컨텍스트를 사용한다. 스프링 컨테이너는 스레드마다 각각 다른 트랜잭션을 할당하기 때문에 같은 엔티티 매니저를 사용해도 트랜잭션이 다르다. 따라서 영속성 컨텍스트가 다르므로 멀티스레드 상황에 안전하다.

스프링이나 JEE 컨테이너의 가장 큰 장점은 트랜잭션과 복잡한 멀티스레드 상황을 컨테이너가 처리해준다는 점이다.

따라서 개발자는 싱글스레드 애플리케이션처럼 단순하게 개발할 수 있고 결과적으로 비즈니스 로직 개발에 집중할 수 있다.

참고링크

영속성 컨텍스트는 엔티티를 영구 저장하는 환경이다. 엔티티 매니저로 엔티티를 저장하거나 조회하면 엔티티 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다. 영속성 컨텍스트의 주요 구성 요소는 1차 캐시와 쓰기 지연 SQL 저장소, 스냅샷이 있다. 1차 캐시를 통해서 같은 트랜잭션 내에 동일한 엔티티 조회시 데이터베이스 접근 없이 캐시에서 엔티티를 반환하여 엔티티의 동일성을 보장한다. 쓰기 지연 저장소에서는 SQL을 저장하고 있다가 트랜잭션 커밋 직전에 한번에 전달하여 성능을 최적화한다. 엔티티의 스냅샷을 엔티티와 함께 저장하여 수정이 일어났을 때 변경사항을 자동으로 감지하여 Update쿼리를 생성한다.

나른한 개발자

Start fast to fail fast

이전 포스트

[SpringBoot] JPA란?

다음 포스트