분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 관리할 수 있는 방안을 사전에 기획
고려사항
1, 가용한 데이터
2, 적절한 시나리오
3, 분석과제 수행을위한 장애 요소
계층적 프로세스 모델:
단계별로 구성요소를 나눈 모델
KDD 분석: 체계적으로
정리한 데이터 마이닝 프로세스
- 패턴을 찾는 9가지 프로세스
① 분석 대상 비즈니스 도메인의 이해
② 분석 대상 데이터셋 선택과 생성
③ 데이터에 정제작업
④ 분석 목적에 맞는 축소와 데이터 변경
⑤ 데이터 마이닝 기법 선택
⑥ 알고리즘 선택
⑦ 시행
⑧ 데이터 마이닝 결과에 대한 해석
⑨ 데이터 마이닝에서 발견된 지식 활용
KDD 분석 절차
1, 데이터셋 선택
2, 전처리
3, 변환
4, 마이닝
5, 마이닝 결과 평가
CRISP-DM 분석 방법론
계층적 프로세스 모델(4개 레벨로 구성)
CRISP-DM 6단계 프로세스
1, 업무 이해 : 문제 정의 및 계획 수립
2, 데이터 이해 : 데이터 수집 및 문제점 파악
3, 준비 : 데이터셋 편성 및 정제
4, 모델링 : 기법과 알고리즘 선택, 최적화 단계
5, 평가 : 분석결과, 모델링 평가
6, 전개 : 유지보수 계획 수립 및보고서 작성