- Partitioned join은 두 테이블을 조인 키에 따라 분할하여 조인을 수행
- 각 노드에서 분할된 테이블을 조인하여 결과를 생성
- 장점
- 네트워크 트래픽을 줄일 수 있음
- 조인 키에 따라 데이터가 분할되어 있으므로 조인을 더 효율적으로 수행할 수 있음
- 단점
- 조인 키에 따라 데이터를 분할해야 하므로 조인 키가 적절하게 선택되어야 함
- 조인 키에 따라 데이터가 고르게 분할되지 않을 경우 성능이 저하될 수 있음
-- set session join_distribution_type = 'PARTITIONED'
- Broadcast join은 작은 테이블을 모든 노드로 브로드캐스트하여 조인을 수행
- 모든 노드에서 조인을 수행하여 결과를 생성
- 장점
- 네트워크 트래픽을 크게 줄일 수 있음
- 작은 테이블을 조인하는 경우 매우 효율적
- 단점
- 큰 테이블을 조인하는 경우 효율적이지 않을 수 있음
- 작은 테이블을 모든 노드로 브로드캐스트해야 하므로 메모리 사용량이 증가할 수 있음
-- set session join_distribution_type = 'BROADCAST'
-- set session join_reordering_strategy = 'NONE'