S3 버킷에 저장된 데이터 분석에 사용하는 서버리스 대화형 쿼리 서비스
- S3 버킷에 저장된 데이터 분석에 사용하는 서버리스 대화형 쿼리 서비스
- 데이터 분석을 위해서는 표준 SQL 언어로 파일을 쿼리해야 함
- CSV, JSON, ORC, Avro, Parguet 등 다양한 형식 지원
- 스캔된 데이터의 TB당 고정 가격 지불 형식, 프로비저닝 필요 없음
- Athena는 Amazon QuickSight라는 툴과 함께 사용하는 경우가 많음
- 임시 쿼리 수행이나 BI 분석 및 보고, AWS 서비스에서 발생하는 모든 로그를 쿼리로 분석하는 데 활용
- VPC Flow 로그, ELB 로그, CloudTrail 등이 해당
- 90일보다 오래된 이벤트의 경우에는 Athena를 사용해 S3 버킷 내에 저장된 CloudTrail 로그를 분석할 수 있음
- 서버리스 SQL 엔진을 사용한 Amazon S3 데이터 분석이라는 말이 나오면 Athena를 떠올릴 것
- 열 (Column) 기반 데이터 유형을 사용하여 비용 절감 가능, Apache Parquet이나 ORC 권장
- 파일이 클수록 스캔과 검색이 쉬움 (128MB 이상)
- 연합 쿼리 기능으로 S3 뿐만 아니라 어떤 곳의 데이터도 쿼리 가능 (관계형 DB, 비관계형 DB, 객체 등)