이론
모델별 학습
| 모델 | 목적 | 키워드 |
|---|---|---|
| Linear Regression | 회귀 | 연속형 예측 |
| Logistic Regression | 분류 | 이진/다중 분류 |
| Decision Tree | 분류/회귀 | 직관적, 과적합 주의 |
| KNN | 분류 | 거리 기반, 전처리 중요 |
| SVM | 분류 | 마진, 커널 |
| Naive Bayes | 텍스트 | 확률 기반 분류기 |
학습 개념
| 기술 | 설명 |
|---|---|
| 결측치 처리 | SimpleImputer, 삭제/대체 |
| 인코딩 | OneHotEncoder, LabelEncoder |
| 정규화 | StandardScaler, MinMaxScaler |
| 파이프라인 | Pipeline으로 전처리 + 모델 합치기 |
학습 개념
| 주제 | 설명 |
|---|---|
| 분류 평가 | 정확도, 정밀도, 재현율, F1, ROC-AUC |
| 회귀 평가 | MSE, RMSE, MAE, R² |
| 교차검증 | cross_val_score() |
| 튜닝 | GridSearchCV, RandomizedSearchCV |
학습 개념
| 모델 | 특징 |
|---|---|
| Random Forest | 다수 트리 → 평균 |
| Gradient Boosting | 순차적 학습 |
| XGBoost | 병렬처리 지원 |
| LightGBM | 속도 빠름, 대규모 데이터 |
| Voting, Stacking | 모델 결합 |