Athena
쿼리 서비스
- 표준 SQL을 사용하여 S3 데이터를 간편하게 분석
- CSV, JSON 또는 컬럼 방식 데이터 형식(apache Parquet, ORC)에 사용.
- 데이터를 쉽게 시각화할 QuickSight과 사용
Redshift
fast, fully managed, petabyte-scale 데이터 웨어하우스
- 대규모 데이터 집합에 최적화되어 있으며, 페타바이트 규모의 데이터까지 처리할 수 있음. 테라바이트 당 연간 비용이 매우 저렴하여 비용 효율적임
- 비즈니스 보고서를 작성하려는 경우 Amazon Redshift와 같은 데이터 웨어하우스가 최적
- Redshift의 쿼리 엔진은 다수의 매우 큰 데이터베이스 테이블을 조인하는 복잡한 쿼리를 실행할 때 특히 효과적
! Athena는 indexes로 더 빠른 queries, joins, aggregations
EMR (Elastic MapReduce)
정교한 데이터 처리 프레임워크
- SQL 쿼리를 실행하는 것 외에도 기계 학습, 그래프 분석, 데이터 변환, 데이터 스트리밍 및 거의 모든 업무의 데이터 처리 작업을 실행
- 온프레미스 배포와 비교할 때 Hadoop, Spark 및 Presto와 최신 빅 데이터 처리 프레임워크를 간단하고 비용 효율적으로 실행하여 매우 큰 데이터 세트를 처리하고 분석 가능
QuickSight
비즈니스 분석을 위한 serverless 서비스로, 데이터를 시각화하고 분석
- 대규모 확장 가능, 많은 사용자 동시 접속 가능
- SPICE 엔진을 사용하여 데이터 처리 및 쿼리 성능을 높이고 응답 시간 줄임
Glue
데이터 통합을 위한 serverless서비스
- 데이터를 수집하고 준비하며 다양한 소스에서 데이터를 통합
- 데이터 분석, 기계 학습 및 애플리케이션 개발을 위한 데이터를 발견, 준비 및 통합하는 과정을 단순화하고 자동화
[참조]
Athena는 언제 사용해야 하나요?
Amazon QuickSight Documentation