Intro
- 책을 읽으며 책 내용을 정리하려합니다.
- 하루에 한 챕터정도 읽으며 책의 내용을 상세하게는 정리하지 않고 키워드나 느낌점을 위주로 정리하려합니다.
Contents
빅데이터 처리의 어려움
- 분석방법의 필요성
- 데이터 처리에 걸리는 수고와 시간
빅데이터의 정착
- 분산시스템의 등장과 데이터 처리의 고속화로 빅데이터 처리의 어려움을 극복
- 빅데이터 기술의 예 -> Hadoop & NoSQL
Hadoop
- 다수의 컴퓨터에서 대량의 데이터를 처리하기 위한 시스템
- 쿼리 언어를 실행시키기 위한 Hive
NoSQL
- Key-value store: 키와 값을 연관지어 저장
- Document Store: JSON과 같은 복잡한 구조를 저장
- Wide-column Store: 여러 키를 사용하여 높은 확장성을 제공
Outro
- 1-1부분을 간단하게 정리해보았습니다.
- 빅데이터 기술의 역사를 짚어보며 빅데이터 처리기술의 필요성을 느끼고 살펴볼 수 있었습니다.
- 작은 칼럼형식으로 스몰데이터와 빅데이터를 비교하여 서술해주었는데 마냥 빅데이터만에 치중되는 것은 좋지 않다는 것을 상기시켜 주는 것 같아 흥미로웠습니다.
- 책의 인트로 부분을 읽고있는데 개념서 같은 느낌이어서 앞으로의 내용이 더욱 기대됩니다.
- 추천해주신 분들이 많은 책입니다. Data Engineer를 희망하시는 분이 계시다면 한번 읽어보셔도 좋을 것 같습니다.