๐ก ํ๋ก์ ๋ถ์ฐ ํ์ผ ์ ์ฅ ์์คํ ์ธ HDFS์ ๋ํด์ ์์๋ด ๋๋ค.
Hadoop Distrubution File System์ ์ฝ์๋ก ์ฐ๋ฆฌ๊ฐ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ๋ ํ๋์จ์ด์๋ ๋์ํ๊ณ , ํ์ผ ์์ ์ ๋ณต๊ตฌ๋ฅผ ํ ์ ์๋ ๋ถ์ฐ๋ ํ์ผ ์์คํ ์ ๋ชฉํ๋ก ํฉ๋๋ค.
์ค์๊ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ณด๋ค๋ ๋ฐฐ์น์ฒ๋ฆฌ๋ฅผ ๋ชฉ์ ์ผ๋ก ์ค๊ณ๋์๊ธฐ ๋๋ฌธ์, ๋น ๋ฅธ ๋ฐ์ดํฐ ์๋ต์๊ฐ์ด ํ์ํ ์์ ์๋ ์ ํฉํ์ง ์์ต๋๋ค.
HDFS๋ 4๊ฐ์ง์ ํน์ง์ด ์์ต๋๋ค.
HDFS๋ ๋ฐ์ดํฐ๋ฅผ ๋ธ๋ก ๋จ์๋ก ์ ์ฅํฉ๋๋ค. ๋ธ๋ก ๋จ์ ๋ณด๋ค ์์ ํ์ผ์ ๊ทธ๋๋ก ์ ์ฅํ๊ณ , ๋ธ๋ก ๋จ์ ๋ณด๋ค ํฐ ํ์ผ์ ๋ธ๋ก์ ๋๋์ด ์ ์ฅํ๊ฒ๋ฉ๋๋ค.
HDFS๋ ์ฅ์ ๋ณต๊ตฌ๋ฅผ ๋ธ๋ก์ ๋ณต์ ๋ฅผ ํ์ฉํด์ ๋ณต๊ตฌ๋ฅผ ํ์ต๋๋ค. ์๋ฅผ ๋ค์ด 1GB์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ค๊ณ ํ๋ฉด, 3GB์ ๋ฐ์ดํฐ๊ฐ ํ์ํ ๊ฒ์ธ๋ฐ์ ํ๋ก v3์ ์์๋ Erasure Coding์ ์ ์ฉํ์ฌ ์ค๋ฅ๋ฅผ ๊ฒ์ถํ๋ ํจ๋ฆฌํฐ ๋ธ๋ก์ ํ์ฉํด์ ๋์คํฌ์ ์ฌ์ฉ๋์ 50%๋ ๊ฐ์ ์์ผฐ์ต๋๋ค.์ฆ ์๋ 3GB๊ฐ ํ์ํ๋ค๋ฉด 1.5GB๋ง ์์ผ๋ฉด ๋๋ ๊ฒ์ ๋๋ค.
HDFS๋ ํ์ผ์ ์ฐ๋ฉด ์ฌ๋ฌ๋ฒ ์ฝ๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํ๊ธฐ๋๋ฌธ์ ์ฐ์ฌ์ง ํ์ผ์ ์์ ํ ์ ์๊ฒ ๋ฉ๋๋ค. ํ์ง๋ง ์ด๋ฅผ ํตํด์ ๋์์ ๋จ์ํํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฝ์ ๋ ์๋๋ฅผ ๋์ผ ์ ์์์ต๋๋ค.
MapReduce๋ HDFS์ Locality๋ฅผ ํ์ฉํด์ ์ฒ๋ฆฌ ์๋๋ฅผ ์ฆ๊ฐ์์ผฐ์ต๋๋ค. ์ฆ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ๋ฐ์ดํฐ๊ฐ ์ค์ ๋ก ์๋ ๊ณณ์์ ์ฒ๋ฆฌ ์๊ณ ๋ฆฌ์ฆ์ ์ํํ์ฌ ๋คํธ์ํฌ๋ฅผ ํตํด ๋ง์ ๋ฐ์ดํฐ๊ฐ ์ด๋ํ๋ ๋น์ฉ์ ์ ๊ฐํ ์ ์์ต๋๋ค.