Amazon Redshift 비용 구조
1. 컴퓨팅 비용
Redshift는 노드 기반으로 요금이 부과되며 클러스터를 구성하는 노드의 수와 유형에 따라 비용이 달라진다.
- 온디맨드 요금: 사용한 시간 단위로 비용이 청구된다. 즉시 확장하거나 축소할 수 있으며, 단기 프로젝트나 일시적인 사용에 적합한 요금제 이다.
- 예약 인스턴스 요금: 1년 또는 3년 단위로 노드를 예약하여 비용을 절감할 수 있다. 장기적인 사용을 계획할 때 유리한 요금제 이다.
2. 스토리지 비용
- RA3 노드: RA3 노드는 분리된 컴퓨팅과 스토리지를 제공하며, S3에 저장된 데이터의 양에 따라 스토리지 비용이 청구된다.
- 기존 노드 유형: 기존 노드에서는 스토리지와 컴퓨팅이 결합되어 있으며, 노드의 용량에 따라 비용이 결정된다.
3. 데이터 전송 비용
- 클러스터 내 데이터 전송: 동일한 AWS 리전 내의 데이터 전송은 무료.
- 리전 간 데이터 전송: 다른 리전으로의 데이터 전송에는 추가 비용이 발생.
4. 스냅샷 비용
- 자동 스냅샷: Redshift는 자동으로 스냅샷을 생성하며, 기본 제공 용량 내에서는 무료이다. 하지만 추가 스냅샷 용량에는 비용이 발생한다.
- 수동 스냅샷: 사용자가 수동으로 생성한 스냅샷에 대해 저장된 데이터의 양에 따라 비용이 청구된다.
Amazon Athena 비용 구조
1. 쿼리 비용
Athena의 주요 비용 요소는 쿼리 실행 시 스캔한 데이터 양이다.
- 데이터 스캔량: 쿼리 실행 시 스캔한 데이터 양(GB 단위)에 따라 비용이 청구된다. 비용을 절감하려면 필요한 데이터만 스캔하도록 쿼리를 최적화해야한다.
2. 데이터 저장 비용
Athena 자체는 데이터를 저장하지 않지만, S3에 저장된 데이터를 쿼리한다. 따라서 S3의 저장 비용이 발생한다.
- S3 스토리지 비용: 저장된 데이터의 양과 스토리지 클래스에 따라 비용이 청구된다. 자주 액세스하지 않는 데이터는 저렴한 스토리지 클래스를 사용하여 비용을 절감할 수 있다.
3. 데이터 전송 비용
- S3와의 데이터 전송: 동일한 리전 내에서 S3와 Athena 간의 데이터 전송은 무료.
- 리전 간 데이터 전송: 다른 리전으로 데이터 전송 시 추가 비용 발생.
비용 비교
Redshift
- 장점: 고성능 데이터 웨어하우스로, 대규모 데이터 처리와 복잡한 쿼리에 최적화되어 있다. 예약 인스턴스를 통해 장기 사용 시 비용을 절감할 수 있다.
- 단점: 초기 비용이 높고, 지속적인 클러스터 운영 비용이 발생한다.
Athena
- 장점: 서버리스 환경으로 초기 비용이 없고, 사용한 만큼만 비용을 지불한다. 데이터 레이크 아키텍처에 적합하며, 다양한 데이터 소스를 손쉽게 분석할 수 있다.
- 단점: 대규모 데이터 스캔 시 비용이 빠르게 증가할 수 있으며, 복잡한 쿼리 성능이 Redshift보다 낮을 수 있다.