HDFS란 하둡은 HDFS라는 분산 파일시스템을 제공한다. (Hadoop Distributed File System) 데이터가 단일 물리 머신의 저장 용량을 초과하게 되면, 전체 데이터셋 분리된 여러 머신에 나눠서 저장할 필요가 있다. 네트워크로 연결된 여러 머신의