아니요, Amazon Athena는 전통적인 데이터베이스는 아닙니다. 대신, AWS에서 제공하는 서버리스 대화형 쿼리 서비스입니다. Athena를 사용하면 S3에 저장된 데이터를 SQL을 사용하여 직접 쿼리할 수 있습니다.
주요 특징
1. 데이터베이스가 아님
• 데이터베이스처럼 데이터를 저장하지 않습니다.
• S3에 저장된 데이터를 대상으로 쿼리를 실행할 뿐입니다.
• 예를 들어, S3에 저장된 로그 파일(CSV, JSON, Parquet, ORC 등)을 SQL로 분석할 수 있습니다.
2. 서버리스
• 서버를 설정하거나 관리할 필요가 없습니다.
• 필요한 만큼의 쿼리 실행에 대한 비용만 지불하면 됩니다(쿼리당 스캔한 데이터 크기 기준).
3. SQL 지원
• 표준 SQL을 사용하여 데이터를 쿼리합니다.
• Athena는 Presto라는 분산 SQL 엔진을 기반으로 작동하며, 강력한 분석 기능을 제공합니다.
4. ETL 없이 데이터 분석 가능
• 데이터를 별도로 데이터베이스로 가져올 필요 없이, S3에서 바로 분석할 수 있습니다.
5. 데이터 소스 통합
• Athena는 AWS Glue Data Catalog와 통합되어 데이터 스키마와 테이블을 관리합니다.
• 다양한 데이터 포맷(CSV, JSON, Parquet, Avro 등)을 지원합니다.
언제 사용하면 좋을까?
• 로그 분석: S3에 저장된 웹 서버 로그, 애플리케이션 로그를 빠르게 분석하고 싶을 때.
• 데이터 레이크 분석: S3에 저장된 대규모 비정형 데이터를 분석할 때.
• Ad-hoc 분석: 짧고 즉흥적인 데이터 분석 작업에 적합.
• 비용 절감: RDS나 Redshift 같은 데이터베이스를 사용하는 대신, 필요할 때만 비용을 지불하면서 데이터를 분석하고 싶을 때.
Amazon Athena와 데이터베이스의 차이
특징 Amazon Athena 전통적인 데이터베이스 (예: RDS)
데이터 저장 데이터를 저장하지 않고 S3에 저장된 데이터를 분석 데이터베이스 내에 데이터를 저장
관리 서버리스, 관리 필요 없음 인프라 관리 및 유지보수 필요
사용 사례 데이터 분석, 로그 분석 트랜잭션 처리, 데이터 관리
비용 구조 쿼리 실행 데이터 스캔량 기준 인스턴스 크기와 실행 시간 기준
결론
Amazon Athena는 데이터베이스가 아니라, S3 데이터에 SQL 기반의 쿼리를 실행할 수 있는 도구입니다. 전통적인 데이터베이스와는 다른 용도로 사용됩니다.