[독서] 빅데이터를 지탱하는 기술 #1

이동욱·2022년 3월 12일
0

독서

목록 보기
1/4

Intro

  • 책을 읽으며 책 내용을 정리하려합니다.
  • 하루에 한 챕터정도 읽으며 책의 내용을 상세하게는 정리하지 않고 키워드나 느낌점을 위주로 정리하려합니다.

Contents

빅데이터 처리의 어려움

  • 분석방법의 필요성
  • 데이터 처리에 걸리는 수고와 시간

빅데이터의 정착

  • 분산시스템의 등장과 데이터 처리의 고속화로 빅데이터 처리의 어려움을 극복
  • 빅데이터 기술의 예 -> Hadoop & NoSQL

Hadoop

  • 다수의 컴퓨터에서 대량의 데이터를 처리하기 위한 시스템
  • 쿼리 언어를 실행시키기 위한 Hive

NoSQL

  • Key-value store: 키와 값을 연관지어 저장
  • Document Store: JSON과 같은 복잡한 구조를 저장
  • Wide-column Store: 여러 키를 사용하여 높은 확장성을 제공

Outro

  • 1-1부분을 간단하게 정리해보았습니다.
  • 빅데이터 기술의 역사를 짚어보며 빅데이터 처리기술의 필요성을 느끼고 살펴볼 수 있었습니다.
  • 작은 칼럼형식으로 스몰데이터와 빅데이터를 비교하여 서술해주었는데 마냥 빅데이터만에 치중되는 것은 좋지 않다는 것을 상기시켜 주는 것 같아 흥미로웠습니다.
  • 책의 인트로 부분을 읽고있는데 개념서 같은 느낌이어서 앞으로의 내용이 더욱 기대됩니다.
  • 추천해주신 분들이 많은 책입니다. Data Engineer를 희망하시는 분이 계시다면 한번 읽어보셔도 좋을 것 같습니다.
profile
공부해서 남주자

0개의 댓글