기업의 합리적인 의사결정을 가로막는 장애요소
고정관념, 편향된생각, 프레이밍효과
암묵지 -> (형식화) -> 형식지 -> (체계화) -> 방법론 -> (내재화) -> 암묵지
암묵지: 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식(공통화, 내면화)
형식지: 문서나 매뉴얼처럼 형상화된 지식(표출화, 연결화)
단계(단계별완료보고서) -> 태스크(보고서) -> 스탭(보고서구성요소)
단계: 최상위 계층으로서 프로세스 그룹을 통하여 완성된 단계별 산출물 생성, 버전관리 등을 통하여 통제
태스크: 단게를 구서하는 단위활동, 물리적/논리적 단위로 품질검토의 항목이 됨
스탭: WBS(Work Breakdown Structure)의 워크패키지에 해당되고, 입력자료, 처리 및 도구, 출력자료로 구성된 단위 프로세스
데이터로부터 통계적 패턴이나 지식을 찾기 위해 활용할 수 있도록 체계적으로 정의된 데이터 마이닝 프로세스
Data - Target Data - Preprocessed Data - Transformed Data - Patterns
1) 데이터셋 선택: 비즈니스 도메인에 대한 이해 + 프로젝트 목표 설정
2) 데이터 전처리: 잡음, 이상치, 결측치 처리
3) 데이터 변환: 차원축소, 학습용/검증용 데이터 분류
4) 데이터 마이닝: 데이터마이닝 기법 선택, 전처리+변환프로세스 추가 실행
5) 데이터 마이닝 결과 평가: 결과에 대한 해석, 평가 + 분석 목적과의 일치성
Phases -> Generic Tasks -> Specialized Tasks -> Process Instances
1. 최상위 레벨: 여러 단계로 구성되고 각 단계는 일반화 태스크(Generic Tasks)를 포함
일반화 태스크는 데이터마이닝의 단일 프로세스를 완전하게 수행하는 단위이며, 다시 구체적인 수행 레벨인 세분화 태스크로 구성
2. 데이터 정제라는 일반화 태스크는 범주형 데이터 정제와 연속형 데이터 정제와 같은 세분화 태스크로 구성
3. 프로세스 실행은 데이터 마이닝을 위한 구체적인 실행을 포함
1. 업무이해: 업무 목적 파악, 상황파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
2. 데이터 이해: 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
3. 데이터 준비: 분석용 데이터셋선택, 데이터 정제, 분석용 데이터셋 편성, 데이터 통합, 데이터 포맷팅
4. 모델링: 모델링 기법 선택, 모델테스트계획설계, 모델작성, 모델평가
5. 평가: 분석결과 평가, 모델링과정 평가, 모델적용성 평가
6. 전개: 전개 계획 수립, 모니터링과 유지보수 계획수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰
1) 단계: 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성
각 단계는 기준선으로 설정되어 관리되어야 하며, 버전관리 등을 통하여 통제가 이뤄져야 함
2) 태스크:
각 단계는 여러 개의 태스크로 구성, 각 태스크는 단계를 구성하는 단위 활동이며 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있음
3) 스텝: WBS(Work Breakdown Structure)의 워크퍁키지에 해당되고 입력자료, 처리 도구, 출력자료로 구성된 단위 프로세스임
1) 분석기획
비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험 계획 수립
2) 데이터 준비
필요 데이터 정의, 데이터 스토어 설계, 데이터 수집 및 정합성 점검
3) 데이터 분석
분석용 데이터 준비, 텍스트 분석, 탐색적 분석, 모델링, 모델 평가 및 검증, 모델 적용 및 운영방안 수립
4) 시스템 구현
설계 및 구현, 시스템 테스트 및 운영
5) 평가 및 설계
모델 발전계획 수립, 프로젝트 평가 및 보고