빅데이터의 정의
- 기존 데이터베이스 관리도구의 데이터 수집, 저장, 관리, 분석 역량을 넘어서는 대량의 정형 또는 비정형 데이터 세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술 (위키피디아)
- 대용량 데이터를 활용, 분석하여 가치 있는 정보를 추출하고 생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술 (국가 전략 위원회)
- 기존의 관리 및 분석 체계로는 감당할 수 없을 정도의 거대한 데이터 집합으로 이러한 대규모 데이터와 관계된 기술 및 도구를 모두 포함하는 개념
가트너에서 정의한 빅데이터 5V
기본 3V (Volume, Velocity, Variety) + Veracity(정확성), Value(가치)

빅데이터 범주의 변화
- 기존 방식으로는 얻을 수 없는 통찰 및 가치 창출과 사업 방식, 시장, 사회, 정부 등에서 변화와 혁신 주도

데이터 vs 정보
- 데이터는 가공되지 않은 일련의 사실들을 의미한다
- 정보는 의미 있고 유용한 형태로 가공된 데이터를 의미
- 데이터를 가치 있는 정보로 가공하기 위해 데이터마이닝이 핵심적인 역할을 수행할 수 있다
DIKW 피라미드
- 데이터 -> 정보 -> 지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층구조로 설명한 것
