오픈 소스 빅데이터 프레임워크로 구축된 애플리케이션을 쉽고 경제적으로 실행
- Elastic MapReduce
- AWS에서 빅 데이터 작업을 위한 Hadoop 클러스터 생성에 사용
- Hadoop 클러스터가 있는 빅데이터와 관련된 내용이 나오면 Amazon EMR을 떠올릴 것
- Hadoop 클러스터는 프로비저닝해야 하며 수백 개의 EC2 인스턴스로 구성될 수 있음
- Amazon EMR은 Apache Spark, HBase, Presto, Flink 등과 같은 서비스에 관한 프로비저닝과 구성을 대신 처리
- 오토 스케일링으로 전체 클러스터 자동으로 확장 및 축소 가능
- 스팟 인스턴스와 통합되므로 가격 할인 혜택 받을 수 있음
- 데이터 처리, 머신 러닝, 웹 인덱싱, 빅데이터 작업에 활용
- Amazon EMR 노드 유형
- Master Node - 클러스터를 관리하고 다른 모든 노드의 상태를 조정, 장기 실행
- Core Node - Task를 실행하고 데이터를 저장, 장기 실행
- Task Node - 선택 사항, 대게 스팟 인스턴스를 사용