시스템 아키텍처
실행 계획을 전달받아 각 슬라이스에서 작업 실행
리더 노드에 결과 전송
디스크와 슬라이스 관리
✅ 클라이언트의 모든 통신은 리더 노드와 이뤄지며 컴퓨팅 노드와 통신 ❌
슬라이스
➡️ 슬라이스는 리더 노드로부터 데이터 관련 작업 요청을 받아 처리한다
슬라이스는 데이터를 병렬로 처리하기 때문에 동시성을 최대화하기 위해서는 노드의 코어 수와 디스크 수를 고려해 슬라이스 수를 결정해야 한다.
➡️ 만약 데이터가 슬라이스에 균등하게 분산되지 않고 특정 슬라이스에 집약적으로 저장되면 해당 슬라이스에서 대부분의 쿼리를 수행하게 된다.
✅ 클러스터의 모든 슬라이스에 데이터를 균등하게 분산하는 작업은 매우 중요하다