Check List | Machine Learning | Deep Learning |
---|---|---|
문제 이해 | 배경과 목적 파악 | 배경과 목적 파악 |
평가 지표 파악 | 평가 지표 파악 | |
탐색적 데이터 분석 (EDA) | 데이터 구조 탐색 | 데이터 구조 탐색 : 대체로 이미지 파일과 약간의 메타 데이터가 주어짐 |
데이터 시각화 : 다양한 그래프를 통해 인사이트 도출 | 데이터 시각화 : 타깃 값 분포 시각화 또는 이미지 출력 데이터 수 충분한지 확인 | |
베이스라인 모델 | 환경 설정 : 결과 재현을 위한 시드값 고정 | |
데이터 준비 : 프레임워크에 맞춘 데이터 준비 & 변환기를 사용한 데이터 증강 | ||
모델 훈련 및 성능 검증 : 머신러닝 파이프라인 구축 및 Feature Engineering (훈련 데이터) | 모델 훈련 및 성능 검증 : 모델을 직접 설계 하거나 pretrained model을 불러와 사용. 손실 함수와 옵티마이저 설정 필수 | |
결과 예측 및 제출 : 성능 개선 시 비교 목적 (훈련 데이터) | 결과 예측 및 제출 : 성능 개선 시 비교 목적 (훈련 데이터) | |
성능 개선 | Feature Engineering : 결측치 제거, 결측값 처리, data encoding, feature engineering, 파생 feature 생성, feature 제거 및 선택 | |
Hyperparameter 최적화 : greed search, random search, bayesian 최적화 | ||
성능 개선 기법 적용 : 옵티마이저 & 스케줄러 새롭게 설정, 테스트 단계 데이터 증강 (TTA), label smoothing 적용 | ||
성능 검증 : 일반화 성능 평가 | 성능 검증 : 일반화 성능 평가 | |
결과 예측 및 제출 | 결과 예측 및 제출 |
시각화 그래프는 이미지가 많으므로 따로 정리한 Github 링크로 대체합니다.
Github 주요 시각화 그래프 정리