오늘 한 일
keyword :
- 모델 선택
- 하이퍼파라미터 최적화 (최적의 하이퍼파라미터 찾기)
- CV 교차검증
- hold-out 교차검증
- K-Fold
- TargetEncoder
- GridSearchCV
- RandomizedSearchCV
- 최적화와 일반화의 차이
- class_weight (불균형(imbalanced) 클래스인 경우, randomforest에서 사용)
- 임계값 조절은 모델 만들고 마지막에
- 우선 cv값은 5~10 정도로
- Grid & Random serch CV
하이퍼 파라미터 설정한 변수내에서 그리드 서치는 변수내 모든 조합을 살펴보고, 랜덤 서치는 랜덤한 조합을 살펴봐서 최적하이퍼 파라미터를 찾습니다.
refrence :
분류, 회귀 모델 성능 평가지표
https://www.youtube.com/watch?v=O-AhNAU6WlY