[JPA 활용2] API 개발 고급 - 컬렉션 조회 최적화 ②

kiteB·2021년 11월 26일

API개발 JPA Spring TIL 컬렉션조회

JPA

목록 보기

27/28

[ 주문 조회 V3.1: 엔티티를 DTO로 변환 - 페이징과 한계 돌파 ]

1. 컬렉션을 페치 조인하면 페이징 불가!

컬렉션을 페치 조인하면 일대다 조인이 발생하므로 데이터가 예측할 수 없이 증가한다.
일대다에서 일을 기준으로 페이징하는 것이 목적인데, 데이터는 다를 기준으로 row가 생성된다.

2. 해결 방법

먼저 xxxToOne(OneToOne, ManyToOne) 관계를 모두 페치 조인한다.
ToOne 관계는 row 수를 증가시키지 않으므로 페이징 쿼리에 영향을 주지 않는다.
컬렉션은 지연 로딩으로 조회한다.
지연 로딩 성능 최적화를 위해 hibernate.default_batch_fetch_size, @BatchSize를 적용한다.
- hibernate.default_batch_fetch_size: 글로벌 설정
- @BatchSize: 개별 최적화
- 이 옵션을 사용하면 컬렉션이나, 프록시 객체를 한꺼번에 설정한 size만큼 IN 쿼리로 조회한다.

`OrderRepository`

public List<Order> findAllWithMemberDelivery(int offset, int limit) {
    return em.createQuery(
            "select o from Order o" +
            " join fetch o.member m" +
            " join fetch o.delivery d", Order.class)
        .setFirstResult(offset)
        .setMaxResults(limit)
        .getResultList();
    }

`OrderApiController`

/**
* V3.1 엔티티를 조회해서 DTO로 변환 페이징 고려
* - ToOne 관계만 우선 모두 페치 조인으로 최적화
* - 컬렉션 관계는 hibernate.default_batch_fetch_size, @BatchSize로 최적화
*/
@GetMapping("/api/v3.1/orders")
public List<OrderDto> ordersV3_page(@RequestParam(value = "offset", defaultValue = "0") int offset,
                                    @RequestParam(value = "limit", defaultValue = "100") int limit) {
                                    
    List<Order> orders = orderRepository.findAllWithMemberDelivery(offset, limit);
    List<OrderDto> result = orders.stream()
        .map(o -> new OrderDto(o))
        .collect(toList());
    return result;
}

최적화 옵션

spring:
    jpa:
        properties:
            hibernate:
	        default_batch_fetch_size: 100

개별로 설정하려면 @BatchSize를 적용하면 된다.

실행 결과

💡 장점

쿼리 호출 수가 1 + N → 1 + 1로 최적화된다.

조인보다 DB 데이터 전송량이 최적화된다.

페치 조인 방식과 비교해서 쿼리 호출 수는 약간 증가하지만, DB 데이터 전송량이 감소한다.

컬렉션 페치 조인은 페이징이 불가능하지만 이 방법은 페이징이 가능하다!

📌 결론!

ToOne 관계는 페치 조인해도 페이징에 영향을 주지 않으므로, 페치 조인으로 쿼리 수를 줄이고 나머지는 hibernate.default_batch_fetch_size로 최적화하자.

[ 주문 조회 V4: JPA에서 DTO 직접 조회 ]

`OrderApiController`에 추가

@GetMapping("/api/v4/orders")
public List<OrderQueryDto> ordersV4() {
    return orderQueryRepository.findOrderQueryDtos();
}

`OrderQueryRepository`

@Repository
@RequiredArgsConstructor
public class OrderQueryRepository {

    private final EntityManager em;
    /**
     * 컬렉션은 별도로 조회
     * Query: 루트 1번, 컬렉션 N 번
     * 단건 조회에서 많이 사용하는 방식
     */
    public List<OrderQueryDto> findOrderQueryDtos() {
        //루트 조회(toOne 코드를 모두 한번에 조회)
        List<OrderQueryDto> result = findOrders();
        //루프를 돌면서 컬렉션 추가(추가 쿼리 실행)
        result.forEach(o -> {
            List<OrderItemQueryDto> orderItems = findOrderItems(o.getOrderId());
            o.setOrderItems(orderItems);
        });
        return result;
    }

    /**
     * 1:N 관계인 orderItems 조회
     */
    private List<OrderItemQueryDto> findOrderItems(Long orderId) {
        return em.createQuery(
                        "select new jpabook.jpashop.repository.order.query.OrderItemQueryDto(oi.order.id, i.name, oi.orderPrice, oi.count)" +
                                " from OrderItem oi" +
                                " join oi.item i" +
                                " where oi.order.id = : orderId", OrderItemQueryDto.class)
                .setParameter("orderId", orderId)
                .getResultList();
    }
    /**
     * 1:N 관계(컬렉션)를 제외한 나머지를 한번에 조회
     */
    private List<OrderQueryDto> findOrders() {
        return em.createQuery(
                        "select new jpabook.jpashop.repository.order.query.OrderQueryDto(o.id, m.name, o.orderDate,                 o.status, d.address)" +
                                " from Order o" +
                                " join o.member m" +
                                " join o.delivery d", OrderQueryDto.class)
                .getResultList();
    }

}

`OrderQueryDto`

@Data
@EqualsAndHashCode(of = "orderId")
public class OrderQueryDto {

    private Long orderId;
    private String name;
    private LocalDateTime orderDate; //주문시간
    private OrderStatus orderStatus;
    private Address address;
    private List<OrderItemQueryDto> orderItems;

    public OrderQueryDto(Long orderId, String name, LocalDateTime orderDate, OrderStatus orderStatus, Address address) {
        this.orderId = orderId;
        this.name = name;
        this.orderDate = orderDate;
        this.orderStatus = orderStatus;
        this.address = address;
    }
}

`OrderItemQueryDto`

@Data
public class OrderItemQueryDto {

    @JsonIgnore
    private Long orderId; //주문번호
    private String itemName;//상품 명
    private int orderPrice; //주문 가격
    private int count; //주문 수량

    public OrderItemQueryDto(Long orderId, String itemName, int orderPrice, int count) {
        this.orderId = orderId;
        this.itemName = itemName;
        this.orderPrice = orderPrice;
        this.count = count;
    }
}

Query: 루트 1번, 컬렉션 N번 실행
ToOne 관계들을 먼저 조회하고, ToMany 관계는 각각 별도로 처리한다. (ToOne 관계는 조인해도 데이터 row 수가 증가하지 않기 때문이다.)
row 수가 증가하지 않는 ToOne 관계는 조인으로 최적화하기 쉬우므로 한번에 조회하고, ToMany 관계는 최적화하기 어려우므로 findOrderItems() 같은 별도의 메서드로 조회한다.

실행 결과

[ 주문 조회 V5: JPA에서 DTO 직접 조회 - 컬렉션 조회 최적화 ]

`OrderApiController`

@GetMapping("/api/v5/orders")
public List<OrderQueryDto> ordersV5() {
    return orderQueryRepository.findAllByDto_optimization();
}

`OrderQueryRepository`

/**
* 최적화
* Query: 루트 1번, 컬렉션 1번
* 데이터를 한꺼번에 처리할 때 많이 사용하는 방식
*
*/
public List<OrderQueryDto> findAllByDto_optimization() {

    //루트 조회(toOne 코드를 모두 한번에 조회)
    List<OrderQueryDto> result = findOrders();

    //orderItem 컬렉션을 MAP 한방에 조회
    Map<Long, List<OrderItemQueryDto>> orderItemMap = findOrderItemMap(toOrderIds(result));

    //루프를 돌면서 컬렉션 추가(추가 쿼리 실행X)
    result.forEach(o -> o.setOrderItems(orderItemMap.get(o.getOrderId())));

    return result;
}

private List<Long> toOrderIds(List<OrderQueryDto> result) {
    return result.stream()
        .map(o -> o.getOrderId())
        .collect(Collectors.toList());
}

private Map<Long, List<OrderItemQueryDto>> findOrderItemMap(List<Long> orderIds) {
    List<OrderItemQueryDto> orderItems = em.createQuery(
            "select new jpabook.jpashop.repository.order.query.OrderItemQueryDto(oi.order.id, i.name, oi.orderPrice, oi.count)" +
            " from OrderItem oi" +
            " join oi.item i" +
            " where oi.order.id in :orderIds", OrderItemQueryDto.class)
        .setParameter("orderIds", orderIds)
        .getResultList();

    return orderItems.stream()
        .collect(Collectors.groupingBy(OrderItemQueryDto::getOrderId));
}

Query: 루트 1번, 컬렉션 1번
ToOne 관계들을 먼저 조회하고, 여기서 얻은 식별자 orderId로 ToMany 관계인 OrderItem을 한꺼번에 조회한다.
MAP을 사용해서 매칭 성능 향상! → (O(1))

실행 결과

[ 주문 조회 V6: JPA에서 DTO로 직접 조회, 플랫 데이터 최적화 ]

`OrderApiController`

@GetMapping("/api/v6/orders")
public List<OrderQueryDto> ordersV6() {
    List<OrderFlatDto> flats = orderQueryRepository.findAllByDto_flat();

    return flats.stream()
        .collect(groupingBy(o -> new OrderQueryDto(o.getOrderId(), o.getName(), o.getOrderDate(), o.getOrderStatus(), o.getAddress()),
            mapping(o -> new OrderItemQueryDto(o.getOrderId(), o.getItemName(), o.getOrderPrice(), o.getCount()), toList())
        )).entrySet().stream()
        .map(e -> new OrderQueryDto(e.getKey().getOrderId(), e.getKey().getName(), e.getKey().getOrderDate(), e.getKey().getOrderStatus(), e.getKey().getAddress(), e.getValue()))
        .collect(toList());
}

`OrderQueryDto`

public OrderQueryDto(Long orderId, String name, LocalDateTime orderDate, OrderStatus orderStatus, Address address, List<OrderItemQueryDto> orderItems) {
    this.orderId = orderId;
    this.name = name;
    this.orderDate = orderDate;
    this.orderStatus = orderStatus;
    this.address = address;
    this.orderItems = orderItems;
}

`OrderQueryRepository`

public List<OrderFlatDto> findAllByDto_flat() {
    return em.createQuery(
            "select new jpabook.jpashop.repository.order.query.OrderFlatDto(o.id, m.name, o.orderDate, o.status, d.address, i.name, oi.orderPrice, oi.count)" +
            " from Order o" +
            " join o.member m" +
            " join o.delivery d" +
            " join o.orderItems oi" +
            " join oi.item i", OrderFlatDto.class)
        .getResultList();
}

`OrderFlatDto`

@Data
public class OrderFlatDto {

    private Long orderId;
    private String name;
    private LocalDateTime orderDate; //주문시간
    private Address address;
    private OrderStatus orderStatus;
    private String itemName;//상품 명
    private int orderPrice; //주문 가격
    private int count; //주문 수량

    public OrderFlatDto(Long orderId, String name, LocalDateTime orderDate, OrderStatus orderStatus, Address address, String itemName, int orderPrice, int count) {
        this.orderId = orderId;
        this.name = name;
        this.orderDate = orderDate;
        this.orderStatus = orderStatus;
        this.address = address;
        this.itemName = itemName;
        this.orderPrice = orderPrice;
        this.count = count;
    }
}

Query: 1번
단점
- 쿼리는 한 번이지만 조인으로 인해 DB에서 애플리케이션에 전달하는 데이터에 중복 데이터가 추가되므로 상황에 따라 V5보다 더 느릴 수도 있다.
- 애플리케이션에서 추가 작업이 크다.
- 페이징 불가능

실행 결과

[ API 개발 고급 정리 ]

엔티티 조회
- 엔티티를 조회해서 그대로 반환: V1
- 엔티티 조회 후 DTO로 변환: V2
- 페치 조인으로 쿼리 수 최적화: V3
- 컬렉션 페이징과 한계 돌파: V3.1
  - 컬렉션은 페치 조인시 페이징이 불가능
  - ToOne 관계는 페치 조인으로 쿼리 수 최적화
  - 컬렉션은 페치 조인 대신에 지연 로딩을 유지하고, hibernate.default_batch_fetch_size, @BatchSize로 최적화
DTO 직접 조회
- JPA에서 DTO를 직접 조회: V4
- 컬렉션 조회 최적화 - 일대다 관계인 컬렉션은 IN 절을 활용해서 메모리에 미리 조회해서 최적화: V5
- 플랫 데이터 최적화 - JOIN 결과를 그대로 조회 후 애플리케이션에서 원하는 모양으로 직접 변환: V6

💡 권장 순서

엔티티 조회 방식으로 우선 접근

페치조인으로 쿼리 수를 최적화

컬렉션 최적화

페이징 필요 ⭕ → hibernate.default_batch_fetch_size, @BatchSize로 최적화

페이징 필요 ❌ → 페치 조인 사용

엔티티 조회 방식으로 해결이 안되면 DTO 조회 방식 사용

DTO 조회 방식으로 해결이 안되면 NativeSQL or 스프링 JdbcTemplate

kiteB

🚧 https://coji.tistory.com/ 🏠

이전 포스트

[JPA 활용2] API 개발 고급 - 컬렉션 조회 최적화 ①

다음 포스트

[JPA 활용2] API 개발 고급 - 컬렉션 조회 최적화 ②

JPA

[ 주문 조회 V3.1: 엔티티를 DTO로 변환 - 페이징과 한계 돌파 ]

1. 컬렉션을 페치 조인하면 페이징 불가!

2. 해결 방법

`OrderRepository`

`OrderApiController`

최적화 옵션

실행 결과

💡 장점

📌 결론!

[ 주문 조회 V4: JPA에서 DTO 직접 조회 ]

`OrderApiController`에 추가

`OrderQueryRepository`

`OrderQueryDto`

`OrderItemQueryDto`

실행 결과

[ 주문 조회 V5: JPA에서 DTO 직접 조회 - 컬렉션 조회 최적화 ]

`OrderApiController`

`OrderQueryRepository`

실행 결과

[ 주문 조회 V6: JPA에서 DTO로 직접 조회, 플랫 데이터 최적화 ]

`OrderApiController`

`OrderQueryDto`

`OrderQueryRepository`

`OrderFlatDto`

실행 결과

[ API 개발 고급 정리 ]

💡 권장 순서

[JPA 활용2] API 개발 고급 - 컬렉션 조회 최적화 ①

[JPA 활용2] OSIV와 성능 최적화

0개의 댓글

[JPA 활용2] API 개발 고급 - 컬렉션 조회 최적화 ②

JPA

[ 주문 조회 V3.1: 엔티티를 DTO로 변환 - 페이징과 한계 돌파 ]

1. 컬렉션을 페치 조인하면 페이징 불가!

2. 해결 방법

OrderRepository

OrderApiController

최적화 옵션

실행 결과

💡 장점

📌 결론!

[ 주문 조회 V4: JPA에서 DTO 직접 조회 ]

OrderApiController에 추가

OrderQueryRepository

OrderQueryDto

OrderItemQueryDto

실행 결과

[ 주문 조회 V5: JPA에서 DTO 직접 조회 - 컬렉션 조회 최적화 ]

OrderApiController

OrderQueryRepository

실행 결과

[ 주문 조회 V6: JPA에서 DTO로 직접 조회, 플랫 데이터 최적화 ]

OrderApiController

OrderQueryDto

OrderQueryRepository

OrderFlatDto

실행 결과

[ API 개발 고급 정리 ]

💡 권장 순서

[JPA 활용2] API 개발 고급 - 컬렉션 조회 최적화 ①

[JPA 활용2] OSIV와 성능 최적화

0개의 댓글

`OrderRepository`

`OrderApiController`

`OrderApiController`에 추가

`OrderQueryRepository`

`OrderQueryDto`

`OrderItemQueryDto`

`OrderApiController`

`OrderQueryRepository`

`OrderApiController`

`OrderQueryDto`

`OrderQueryRepository`

`OrderFlatDto`