막대한 향의 정형 또는 비정형 데이터 집합
빅데이터를 효과적으로 분석함으로써 미래를 예측해 최적의 대응 방안을 찾고, 이를 수익으로 연결하여 새로운 가치 창출
다양한 채널에서 소비자와 상호 작용을 통해 생성된 것
마케팅에 있어 효율적이고 다양한 데이터
이전에 사용하지 않거나 알지 못했던 새로운 데이터나 기존 데이터에 새로운 가치가 더해진 데이터
일련의 데이터를 정의하고 설명해 주는 데이터
컴퓨터에서는 데이터 사전의 내용, 스키마 등을 의미
HTML 문서에서는 메타 태그 내의 내용이 메타 데이터
디지털 정보 자원을 장기적으로 보존하기 위한 작업
아날로그 콘텐츠는 디지털로 변환 후 압축해서 저장
디지털 콘텐츠도 체계적으로 분류하고 메타 데이터를 만들어 DB화 하는 작업
오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼
데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트에어 프레임워크
대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델
연관성 있는 데이터 분류로 묶는 Map 작업 수행 후 중복 데이터 제고하고, 원하는 데이터를 추출하는 Reduce 작업 수행
Google 에 의해 고안
데이터 삭제가 아니라 압축하고
중복된 정보는 중복 배제
새로운 기존에 따라 나누어 저장
대량이 데이터 분석
데이터에 내재도니 변수 사이의 상호 관계를 규명
일정한 패턴 찾아냄
다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석
⇒ 의사결정에 활용
OLAP 연산
리스트의 한쪽 끝으로만 자료의 삽입, 삭제 작업이 이루어지는 자료 구조
후입선출(LIFO; Last In First Out)
리스트의 한쪽에서는 삽입 작업, 다른 한쪽에서는 삭제 작업이 이루어지는 자료구조
선입선출(FIFO; First In First Out)
정규화를 거치지 않으면 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상 발생
⇒ 이상
삽입 이상, 삭제 이상, 갱신 이상
릴레이션을 구성하는 속성들 중 튜플을 유일하게 식별하기 위해 사용하는 속성들의 부분집합
⇒ 기본키로 사용할 수 있는 속성
모든 튜플에 대해서 유일성과 최소성을 만족시켜야 함
후보키 중에서 특별히 선정된 주키
중복된 값을 가질 수 없음
기본키를 제외한 나머지 후보키를 의미
보조키 라고도 함
릴레이션 내에 있는 속성들의 집합으로 구성된 키
모든 튜플에 대해 유일성은 만족시키지만, 최소성은 만족시키지 못함