빅데이터: 데이터 베이스 저장, 관리, 분석할 수 있는 범위를 초과하는 규모
다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치 추출 및 초고속 수집, 발굴, 분석을 지원하도록 고안된 기술.
빅데이터는 세가지 측면, 양, 다양성, 속도.
효과: 기존 방식으로는 얻을 수 없었던 통찰 및 가치 창출, 정부, 사업, 변화 혁신
빅데이터 출현 배경: 저장 장치의 가격 하락, 정보 생산량 폭증
전쟁 -> 데이터 증가
사전 -> 사후처리, 표본조사 -> 전수조사, 질 -> 양, 인과관계 -> 상관관계
데이터 활용 방식, 새로운 가치 창출, 분석 기술 발전
빅데이터 영향: 기업 -> 생산성 향상(검색), 정부 -> 상황 분석(교통 정보), 개인 -> 목적에 활용(가수 선곡) -> 생활 전반의 스마트화
①연관 규칙 학습: 상관관계가 있는지 찾아내는 것 /
예: 탄산음료를 구매하는 사람이 과자를 더많이 사는가?
②유형 분석: 사건이 속하게 될 범주를 찾아내는 것 /
예: 이 사용자는 어떤 특성을 가진 집단에 속하는가?
③유전 알고리즘: 자연선택 등 점진적 진화 시켜나가는 것 /
예: 최대의 조회수를 얻으려면 어떤 방송을 어떤 시간대에 방송해야 하는가?
④기계 학습: 예측하는 일에 초점 /
예: 추천 서비스
⑤회귀 분석: 독립변수, 종속변수의 관계 파악 /
예: 구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는가?
⑥감정 분석: 감정을 분석 /
예: 새로운 환불 정책에 대한 고객의 평가는 어떤가?
사생활 침해, 책임 원칙 훼손, 데이터 오용. 동의->책임, 결과 기반 책임 원칙, 알고리즘 접근 허용