출처 : https://www.oracle.com/kr/big-data/what-is-big-data/
양이 매우 많고, 증가속도가 매우 빠르며, 종류가 매우 다양한 데이터.
3V : volume, velocity, variety
volume : 데이터양이 크게 증가했다.
velocity : 일정시간당 수신 및 처리되는 데이터양이 크게 증가했다.
variety : 전통적인, 정형화된 데이터 외에도 비정형/반정형 데이터가 나타났다(텍스트, 오디오, 비디오 등).
여기에 최근에는 2v가 더 붙었다.
value (값)과 veracity(정확성)이다.
의미있는, 프로세싱이 가능한 '값'인가?
그리고 그 값을 우리가 그대로 데이터로 받아들일 수 있는 신빙성있는 것, 즉 '정확한' 값인가?
역사는 반복된다.
데이터로 반복되는 패턴을 구성하고, 미래를 예측한다.
- 결과 예측
- 신제품을 출시하면 고객 수요는 어느정도가 될까?
- 서비스를 개선하면, 디자인을 바꾸면, 방식을 바꾸면... 수요는 어떻게 변할까? 변화로 인한 가치는 어떻게 변할까?
- 문제 예측
- 장비가 언제 고장이 날까? 언제쯤 새 기계로 대체할 준비를 해야 할까?
- 모델링
- 무엇으로 측정해야 할까? 어떤 기준으로 평가할 수 있을까?
기존에도 물류 및 커머스 데이터가 많음 (계열사 : GS수퍼마켓, GS25, 랄라블라)
<데이터 추가>
요기요 인수 -> 딜리버리 커머스 플랫폼으로서의 데이터도 추가되었음
LG유플러스와 MOU -> AI영상인식이 가능한 CCTV 설치 -> 소매점 상품 진열과 고객 프로모션에 활용