Redshift vs Athena 01

Q·2024년 5월 17일
0

AWS

목록 보기
12/15

Amazon Redshift 비용 구조

1. 컴퓨팅 비용

Redshift는 노드 기반으로 요금이 부과되며 클러스터를 구성하는 노드의 수와 유형에 따라 비용이 달라진다.

  • 온디맨드 요금: 사용한 시간 단위로 비용이 청구된다. 즉시 확장하거나 축소할 수 있으며, 단기 프로젝트나 일시적인 사용에 적합한 요금제 이다.
  • 예약 인스턴스 요금: 1년 또는 3년 단위로 노드를 예약하여 비용을 절감할 수 있다. 장기적인 사용을 계획할 때 유리한 요금제 이다.

2. 스토리지 비용

  • RA3 노드: RA3 노드는 분리된 컴퓨팅과 스토리지를 제공하며, S3에 저장된 데이터의 양에 따라 스토리지 비용이 청구된다.
  • 기존 노드 유형: 기존 노드에서는 스토리지와 컴퓨팅이 결합되어 있으며, 노드의 용량에 따라 비용이 결정된다.

3. 데이터 전송 비용

  • 클러스터 내 데이터 전송: 동일한 AWS 리전 내의 데이터 전송은 무료.
  • 리전 간 데이터 전송: 다른 리전으로의 데이터 전송에는 추가 비용이 발생.

4. 스냅샷 비용

  • 자동 스냅샷: Redshift는 자동으로 스냅샷을 생성하며, 기본 제공 용량 내에서는 무료이다. 하지만 추가 스냅샷 용량에는 비용이 발생한다.
  • 수동 스냅샷: 사용자가 수동으로 생성한 스냅샷에 대해 저장된 데이터의 양에 따라 비용이 청구된다.

Amazon Athena 비용 구조

1. 쿼리 비용

Athena의 주요 비용 요소는 쿼리 실행 시 스캔한 데이터 양이다.

  • 데이터 스캔량: 쿼리 실행 시 스캔한 데이터 양(GB 단위)에 따라 비용이 청구된다. 비용을 절감하려면 필요한 데이터만 스캔하도록 쿼리를 최적화해야한다.
    • 예: 1TB의 데이터를 스캔시 $5 청구

2. 데이터 저장 비용

Athena 자체는 데이터를 저장하지 않지만, S3에 저장된 데이터를 쿼리한다. 따라서 S3의 저장 비용이 발생한다.

  • S3 스토리지 비용: 저장된 데이터의 양과 스토리지 클래스에 따라 비용이 청구된다. 자주 액세스하지 않는 데이터는 저렴한 스토리지 클래스를 사용하여 비용을 절감할 수 있다.

3. 데이터 전송 비용

  • S3와의 데이터 전송: 동일한 리전 내에서 S3와 Athena 간의 데이터 전송은 무료.
  • 리전 간 데이터 전송: 다른 리전으로 데이터 전송 시 추가 비용 발생.

비용 비교

Redshift

  • 장점: 고성능 데이터 웨어하우스로, 대규모 데이터 처리와 복잡한 쿼리에 최적화되어 있다. 예약 인스턴스를 통해 장기 사용 시 비용을 절감할 수 있다.
  • 단점: 초기 비용이 높고, 지속적인 클러스터 운영 비용이 발생한다.

Athena

  • 장점: 서버리스 환경으로 초기 비용이 없고, 사용한 만큼만 비용을 지불한다. 데이터 레이크 아키텍처에 적합하며, 다양한 데이터 소스를 손쉽게 분석할 수 있다.
  • 단점: 대규모 데이터 스캔 시 비용이 빠르게 증가할 수 있으며, 복잡한 쿼리 성능이 Redshift보다 낮을 수 있다.
profile
Data Engineer

0개의 댓글