하둡이란 한 번에 여러 디스크로부터 데이터를 읽어내어, 여러 대의 컴퓨터 클러스터에서 대규모 데이터셋을 분산처리할 수 있는 프레임워크이다.Java로 작성된 Apache 오픈소스 플랫폼이다.온라인 서비스와 데이터 처리 기술의 발전으로 데이터 양과 종류가 급증하며, 기존의