MapReduce란 ? Map과 reduce의 합성어이며, map의 key, value 방식을 이용해 빅데이터를 각 다른 노드에 분산 저장하지만 하나의 노드에 저장된것처럼 보이는 방법
1. mapper에서는 map의 싱글 HDFS 블록들에 대해 각 Map작업이 수행되며, Map 작업들은 대체로 블록이 저장된 노드에서 실행된다.( key값을 기준으로 같은것들 끼리 묶어 배열값으로 저장)
2. shuffle & sort : mapper 에서 Map(key, value)작업이 끝나면 각 노드에 shuffle & sort작업이 수행된뒤 reduce 작업이 실행되기 전 종료된다. ( 이 작업에서 한 곳으로 모음 )
3. shuffle & sort 작업이 종료된 후 작업이 실행되며 최종산출물을 뽑아낸다.