맵리듀스(MapReduce)는 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델이다.
1 . 임의의 순서로 정렬된 데이터를 분산처리(Map)한다.
2 . 맵 함수의 결과를 취합하기 위해 리듀스(Reduce)함수로 데이터를 전달한다.(Shuffle)
3 . 전달된 데이터를 다시 합친다.(Reduce)
장점 | 단점 |
---|---|
단순하고 사용이 편리 | 고정된 단일 데이터 흐름 |
유연성 | 스키마, 인덱스, 고차원 언어 등의 미지원 |
저장 구조와의 독립성 | 단순한 스케쥴링 |
내고장성 | 상대적으로 낮은 성능 |
높은 확장성 | 개발도구의 불편함과 기술지원의 어려움 |
참조)
https://smart.science.go.kr/upload_data/subject/bigdata/pdf/B_E_09.pdf
https://sungwookkang.com/756