[AWS SAA] Athena, Redshift, Opensearch, EMR, QuickSight, Glue (Data & Analytics 데이터, 분석)

인바다·2023년 10월 15일

EMR GLUE Opensearch SAA athena aws cloud quicksight redshift

AWS-SSA 개념들 빠르게 훑기

목록 보기

7/13

Athena

쿼리 서비스

표준 SQL을 사용하여 S3 데이터를 간편하게 분석
CSV, JSON 또는 컬럼 방식 데이터 형식(apache Parquet, ORC)에 사용.
데이터를 쉽게 시각화할 QuickSight과 사용

Redshift

fast, fully managed, petabyte-scale 데이터 웨어하우스

대규모 데이터 집합에 최적화되어 있으며, 페타바이트 규모의 데이터까지 처리할 수 있음. 테라바이트 당 연간 비용이 매우 저렴하여 비용 효율적임
비즈니스 보고서를 작성하려는 경우 Amazon Redshift와 같은 데이터 웨어하우스가 최적
Redshift의 쿼리 엔진은 다수의 매우 큰 데이터베이스 테이블을 조인하는 복잡한 쿼리를 실행할 때 특히 효과적
! Athena는 indexes로 더 빠른 queries, joins, aggregations

EMR (Elastic MapReduce)

정교한 데이터 처리 프레임워크

SQL 쿼리를 실행하는 것 외에도 기계 학습, 그래프 분석, 데이터 변환, 데이터 스트리밍 및 거의 모든 업무의 데이터 처리 작업을 실행
온프레미스 배포와 비교할 때 Hadoop, Spark 및 Presto와 최신 빅 데이터 처리 프레임워크를 간단하고 비용 효율적으로 실행하여 매우 큰 데이터 세트를 처리하고 분석 가능

QuickSight

비즈니스 분석을 위한 serverless 서비스로, 데이터를 시각화하고 분석

대규모 확장 가능, 많은 사용자 동시 접속 가능
SPICE 엔진을 사용하여 데이터 처리 및 쿼리 성능을 높이고 응답 시간 줄임

Glue

데이터 통합을 위한 serverless서비스

데이터를 수집하고 준비하며 다양한 소스에서 데이터를 통합
데이터 분석, 기계 학습 및 애플리케이션 개발을 위한 데이터를 발견, 준비 및 통합하는 과정을 단순화하고 자동화

[참조]

Athena는 언제 사용해야 하나요?
Amazon QuickSight Documentation

insea

이전 포스트

[AWS SAA] CloudWatch vs CloudTrail vs AWS Config

다음 포스트

[AWS SAA] SQS, SNS, Kinesis - Decoupling Application

0개의 댓글