Amazon Redshift(4)

ggulcha·2022년 8월 1일
1

Amazon Redshift

목록 보기
4/10

시스템 아키텍처

  • 리더 노드 (1개)
    - 클라이언트와의 통신 (jdbc/odbc)
    • 컴퓨팅 노드와 통신관리
    • 테이블과 컬럼 및 관리용 메타 데이터 보관
    • 슬라이스가 담당하는 데이터 영역 관리
    • 쿼리 플래닝
    • 작업 스케줄 관리
  • 컴퓨팅 노드 (n개)
    • 실행 계획을 전달받아 각 슬라이스에서 작업 실행

    • 리더 노드에 결과 전송

    • 디스크와 슬라이스 관리

      ✅ 클라이언트의 모든 통신은 리더 노드와 이뤄지며 컴퓨팅 노드와 통신 ❌

슬라이스

  • 데이터 영역 담당
  • 데이터 I/O 처리

➡️ 슬라이스는 리더 노드로부터 데이터 관련 작업 요청을 받아 처리한다
슬라이스는 데이터를 병렬로 처리하기 때문에 동시성을 최대화하기 위해서는 노드의 코어 수와 디스크 수를 고려해 슬라이스 수를 결정해야 한다.

➡️ 만약 데이터가 슬라이스에 균등하게 분산되지 않고 특정 슬라이스에 집약적으로 저장되면 해당 슬라이스에서 대부분의 쿼리를 수행하게 된다.

✅ 클러스터의 모든 슬라이스에 데이터를 균등하게 분산하는 작업은 매우 중요하다

0개의 댓글