[분석] Athena

devyu·2023년 10월 9일

🌟 SAA 단어장

목록 보기
3/8
post-thumbnail

S3 버킷에 저장된 데이터 분석에 사용하는 서버리스 대화형 쿼리 서비스

  • S3 버킷에 저장된 데이터 분석에 사용하는 서버리스 대화형 쿼리 서비스
  • 데이터 분석을 위해서는 표준 SQL 언어로 파일을 쿼리해야 함
  • CSV, JSON, ORC, Avro, Parguet 등 다양한 형식 지원
  • 스캔된 데이터의 TB당 고정 가격 지불 형식, 프로비저닝 필요 없음
  • Athena는 Amazon QuickSight라는 툴과 함께 사용하는 경우가 많음
  • 임시 쿼리 수행이나 BI 분석 및 보고, AWS 서비스에서 발생하는 모든 로그를 쿼리로 분석하는 데 활용
  • VPC Flow 로그, ELB 로그, CloudTrail 등이 해당
    • 90일보다 오래된 이벤트의 경우에는 Athena를 사용해 S3 버킷 내에 저장된 CloudTrail 로그를 분석할 수 있음
  • 서버리스 SQL 엔진을 사용한 Amazon S3 데이터 분석이라는 말이 나오면 Athena를 떠올릴 것
  • 열 (Column) 기반 데이터 유형을 사용하여 비용 절감 가능, Apache Parquet이나 ORC 권장
  • 파일이 클수록 스캔과 검색이 쉬움 (128MB 이상)
  • 연합 쿼리 기능으로 S3 뿐만 아니라 어떤 곳의 데이터도 쿼리 가능 (관계형 DB, 비관계형 DB, 객체 등)
profile
티스토리와 벨로그 사이 줄타기....

0개의 댓글