앞부분만 읽어봤을 때는 병목현상을 줄이기 위해 고안한 방법인거 같다. 직접적인 교환이 아니라 Chunk server를 통해 교환하는 방식을 사용하고, Hadoop의 원조격이라고 한다.
2003년 소개, 구글의 데이터 처리를 위하여 설계된 대용량 분산 파일 시스템이다.
구글에서 사용하는 많은 소프트웨어가 GFS로부터 데이터를 읽고 가공하여 다시 GFS에 여러 개로 복제하여 저장한다.
Master, chunk server, client로 구성되고 Master는 중앙 서버 역할, chunk server는 물리적인 하드 디스크에 입출력을 처리하고, Client는 파일을 읽고 쓰는 동작을 요청하는 어플리케이션을 말한다.
클라이언트로부터 마스터로 요청을 보내면 마스터에서는 가장 가까운 chunk server에서 응답하여 동작을 수행(정보를 전달)한다.
Failuer tolerance, chunk server의 고장 시 마스터는 다른 chunk server를 사용하여 처리하고, 마스터 서버가 고장 시 외부 장비가 마스터의 고장여부를 판단하여 chunk server를 마스터로 사용하는 등의 무정지 기능을 구현하여 안정성이 뛰어난 시스템이다.