Athena 개념
ANSI SQL
DBMS 특성에 따라 SQL이 다르므로 미국 표준협회(American National Standards Institute)에서 이를 표준화하여 표준 SQL문을 정립 시켜놓은 것
Athena 특징
1. 관리해야 하는 클러스터, 설정하거나 관리할 인프라가 없는 서버리스 형태 (Serverless)로 복잡한 ETL 설정 없이 사용 가능
2. 별다른 설치 없이 AWS Console에 접속하여 편리하게 사용
3. 쿼리를 병렬로 실행하여 대규모 데이터 집합과 복잡한 쿼리에서도 빠르게 결과를 얻을 수 있음
4. Amazon S3에 있는 데이터를 로딩하거나 변환시킬 필요 없이 직접 쿼리 실행 가능
5. 데이터가 파티션 단위로 나뉘어 있기 때문에 실시간 조회 불가능
Athena 쿼리
데이터 파티셔닝
용량이 큰 테이블이나 인덱스를 관리하기 쉬운 파티션(partition)이라는 작은 단위로 분할하는 것
Athena 비용
테이블 생성 쿼리 예시
CREATE EXTERNAL TABLE point_log (
id STRING,
age STRING,
yearMonth DATE,
increase INT,
point INT,
) PARTITIONED BY (id STRING, yearMonth DATE)
LOCATION 's3://bucket_name/[folder]/'
테이블 생성할 때 external
필수로 붙여야 함
Athena 화면