# bigdata

6개의 포스트
post-thumbnail

빅데이터 #1 - MapReduce

MapReduce 데이터를 맵핑하고 정렬, 그룹핑을 통해 그 수를 줄여나가는 기법 문서에 등장한 각 단어의 수를 세는 word counting 과정을 통해 map reduce를 이해해보자.

2020년 11월 17일
·
2개의 댓글
post-thumbnail

Couchbase 101

분산 Key-Value 데이터베이스, 카우치베이스에 알아보도록 합시다!Manufacturing은 소프트웨어 개발에 널리 사용되는 메타포입니다. 이 메타포에 한 가지 추론할 수 있는 것은 고도로 숙련된 엔지니어는 제품을 설계하고, 덜 숙련된 노동자는 설계된 제품을 조립합

2020년 11월 8일
·
0개의 댓글
post-thumbnail

[빅데이터 기초 개념, 동인, 기법(시그마프레스)]

비즈니스 + 공학, 어느 정도 지식이 있다면 추천! 아니면 조금 더 쉬운 책을 접하고 읽기!

2020년 10월 4일
·
0개의 댓글

빅데이터 Ch.1 데이터 정제

(1) 빅데이터 분석 시 정제를 통해 함수 사용의 Error나 결과치 왜곡을 방지한다. (2) pandas, matplotlib 라이브러리 패키지를 사용한다.

2020년 8월 10일
·
0개의 댓글
post-thumbnail

Hadoop 환경설정 및 설치 (2/2)

Hadoop 환경설정 및 설치 (2/2) 슬라이드44.PNG 슬라이드45.PNG 슬라이드46.PNG 슬라이드47.PNG ![슬라이드48.PNG](https://images.velog.io/post-images

2020년 2월 9일
·
0개의 댓글

Elasticsearch template 사용 방법

Elasticsearch 인덱스 생성시 mapping을 하게 되는데, 이때 template 을 이용하게 되면 굉장히 편리하게 mapping을 할 수 가 있다. 템플릿 생성하기 httpd-access-log 라는 이름의 템플릿을 생성한다. 이때 인덱스 이름이 httpd-access-* 의 패턴이라면, 해당 템플릿이 적용된다.

2019년 12월 19일
·
0개의 댓글