-
문제 정의 (Probelm Identification)
- 비즈니스 목적 정의 모델을 어떻게 사용해 이익을 얻을까?
- 현재 솔루션의 구성 파악
- 예) 지도/비지도/강화 중 무엇인지
-
데이터 수집 (DataCollect)
- File(CSV, XML, JSON …)
- Database
- Web Crwaler (뉴스, SNS, 블로그)
- IoT 센서를 통합 수집
- Survey
-
데이터 전처리 (Data Preprocessing)
분석을 위해 데이터 예쁘고 깔끔하게 만드는 것
-
탐색적 데이터분석(EDA)
- 데이터 어떻게 생겼는지 보는 과정~
- EDA 방법
- 기술통계, 변수간 상관관계 등
- 시각화: pandas, matplotlib, seaborn 등
- feature seletion (사용할 특성 선택)
-
Model 선택, Hyper Parameter 조정
- Hyper Parameter: model 을 조정할 수 있는 부분(인간이 조정할 수 있는 것)
- 모델 객체 생성됨 (빈 깡통 상태!)
-
학습(training)
-
평가(evaluation)