데이터를 분석하기 위해서는 데이터 분석 셋을 만들어야 한다. 그것이 데이터 마트대기업은 데이터 웨어하우스와 데이터 마트를 통해 분석 데이터를 가져와서 사용한다.데이터 웨어하우스(Data Werehouse) : 기업이나 조직의 다양한 소스로부터 수집한 데이터를 통합, 저
사용자의 의사결정 지원을 위해 데이터를 분석 가능한 형태로 저장한 중앙 저장소로서, 정보(data)와 창고(warehouse)의 합성어이다.기존 정보를 활용해 더 나은 정보를 제공하고, 데이터의 품질을 향상시키며, 조직의 변화를 지원하고 비용과 자원관리의 효율성을 향상

4장 통계 분석 1절 통계분석의 이해 (1) 통계 및 자료 획득 방법 통계 정의 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 - 표, 그림, 그래프 ex) 일기예보, 물가/실업률/GNP, 정당 지지도, 의식조사와 사회조사
4장 통계 분석 2절 기초 통계분석 (1) 기술통계 기술통계(Descriptive Statistics)의 정의 자료의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것 자료를 요약하는 기초적 통계를 의미 데이터 분석에 앞서 데이터의
회귀분석(Regression analysis)의 정의하나나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 기법변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심 있는 변수를 예측하거나 추론하기 위한 분석 방법회귀분석의 변수영향을 받는 변수(y)
시간의 흐름에 따라 관찰된 값들을 시계열 자료라 함시계열 데이터 분석의 목적 \- 미래의 값을 예측(향후 일주일간 주가 예측, 다음 달 매출액 예측 등) \- 시계열 데이터의 특성 파악(경향, 주기, 계절성, 불규칙성 등)일변량시계열분석 - Box-Jenki
객체 간 근접성(Proximity)을 시각화하는 통계 기법군집분석과 같이 개체들을 대상으로 변수들을 측정한 수에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석 방법개체들을 2차원 또는 3차원 공간상에 점으로 표현하는 개체들 사이
여러 변수들의 변량을 '주성분(Principal Component)'이라는 서로 상관성이 높은 변수들의 선형결합으로 만들어 기존의 상관성이 높은 변수들을 요약, 축소하는 기법첫 번째 주성분으로 전체 변동을 가장 많이 설명할 수 있도록 하고, 두 번째 주성분으로는 첫 번
데이터 마이닝은 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법데이터 마이닝의 기법인 분류분석, 예측분석, 군집분석 등을 이해하고 적용해 본다.통계분석가설이나 가정에 따른 분석이나 검증을 함데이터 마이닝데이터 마이닝은 대용량 데이터에서
5장 정형 데이터 마이닝 2절 분류분석 (1) 분류분석과 예측분석 정의 분류분석 데이터를 특정 범주(클래스)로 분류하는 분석 데이터의 실체가 어떤 그룹에 속하는지 예측하는데 사용되는 기법 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어
의사결정나무(Decision tree)는 분류함수를 의사결정 규칙으로 이뤄진 나무 모양으로 그리는 방법나무 구조는 연속적으로 발생하는 의사결정 문제를 시각화해 의사결정이 이뤄지는 시점과 성과를 한눈에 볼 수 있게 함계산 결과가 의사결정나무에 직접 나타나게 돼 분석이 간
주어진 자료로부터 여러 개의 예측 모형들을 만든 후 예측 모형들을 조합하여 하나의 최종 예측 모형을 만드는 방법 : 다중모델 결합(combinning multiple models), 분류기 조합(classifier combination)배깅(bagging : boos
"인간의 놀라운 인식력과 판단력은 단순한 기능을 가진 몇 개의 신경세포 조합에 의해 행해진다."$$인간의\\quad 신경세포\\quad 조직을 \\quad인위로 \\quad만들 \\quad수 \\quad없을까?$$1943년 매컬릭(McCulloch)과 피츠(Pitts)
Unsupervised learning각 객체(대상)의 유사성을 측정하여 유사성을 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체 간의 상이성을 규명하는 분석 방법특성에 따라 고객을 여러 개의 배타적인 집단으로 나누는 것군집의 개
연관성 분석(Association Analysis)연관성 분석은 흔히 장바구니 분석(Market Basket Analysis) 또는 서열 분석(Sequence Analysis)이라고 불림연관성 규칙의 개념기업의 데이터베이스에서 상품의 구매, 서비스 등 일련의 거래 또는