데이터 웨어하우스와 사용자의 중간층에 위치, 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있는 DB데이터를 원하는 형태로 바꿔주는 melt함수와 원하는 부분만 선택하는 cast함수로 구성변수를 조합해 변수명을 만들고 변수들의 시간, 상품 등의 차원
존재적 특성: 데이터 있는 그대로의 사실(Fact)당위적 특성: 데이터는 추론, 예측, 전망, 추정을 위한 근거정성적 데이터: 언어, 문자정량적 데이터: 수치, 도형, 기호정형 데이터: CSV, Excel, SpreadSheet비정형 데이터: 소셜 데이터, 댓글, 영상
분석 대상이 무엇인지 알고, 분석 방법도 알고 있다면 최적화(Optimization) 분석 대상이 무엇인지 알고, 분석 방법을 모른다면 해결책(Solution)분석 대상이 무엇인지 모르고, 분석 방법은 알고 있다면 통찰(Insight) 분석 대상이 무엇인지 모르고
R은 오픈 소스 프로그램으로 통계, 데이터마이닝을 위한 언어이다.윈도우, 맥, 리눅스 OS에서 사용 가능객체 지향 언어이며 함수형 언어이다. 즉 통계 기능뿐 아니라 일반 프로그래밍 언어처럼 자동화하거나 새로운 함수를 생성하여 사용 가능하다.객체 지향 언어는 필요한 부분