Yarn & MapReduce

오민석·2022년 4월 23일
0

HDFS

NameNode : 메타데이터 및 데이터노드 관리
DataNode : 파일 저장하고, 파일은 블록단위로 저장.

YARN

클러스터에 작업 제출되면 수많은 작업들을 관리하고, 특정 작업에 사용될 자원을 관리
Resouce Manager와 Application Master 데몬 실행

Resource Manager

  • Scheduler와 Application Manager로 구성
  • Scheduler :
  • Application Manager :
    Application ID 생성
    가능한 node에 Application Master 생성(등록)
    주기적으로 Application Master로 부터 job에 대한 상태 모니터링

Node Manager

  • 해당 노드의 Resource관리
  • Resouce Manager에 containter 자원 사용량 감시 및 RM에 전송
  • Resouce Manager에 등록되며 지속적으로 heartbeats전송

Application Master

단일 작업을 의미하며, 각 단일 작업은 하나의 AM을 갖는다. NM과 작동하며 task실행시키고 모니터링하며 RM을 통해 자원(container)을 할당받는다. 이것들의 상태를 모니터링하며 RM에 heartbeats를 전송한다.
container 실행시키기 위해 slave node의 Node Manager에게 container 새엇ㅇ 요청

Reference

https://phoenixnap.com/kb/hadoop-mapreduce
https://velog.io/@kimdukbae/MapReduce

0개의 댓글