c.haha.e 블로그

c.haha.e 블로그

머신러닝

c.haha.e·2025년 8월 12일

STUDY

목록 보기

12/27

1단계. 머신러닝 핵심 개념 잡기

이론

머신러닝이란? (지도/비지도/강화학습 차이)
회귀 vs 분류
과적합, 편향-분산 트레이드 오프

2단계. 알고리즘 익히기 (Scikit-learn 기반)

모델별 학습

모델	목적	키워드
Linear Regression	회귀	연속형 예측
Logistic Regression	분류	이진/다중 분류
Decision Tree	분류/회귀	직관적, 과적합 주의
KNN	분류	거리 기반, 전처리 중요
SVM	분류	마진, 커널
Naive Bayes	텍스트	확률 기반 분류기

3단계. 데이터 전처리 + 특성 엔지니어링

학습 개념

기술	설명
결측치 처리	`SimpleImputer`, 삭제/대체
인코딩	`OneHotEncoder`, `LabelEncoder`
정규화	`StandardScaler`, `MinMaxScaler`
파이프라인	`Pipeline`으로 전처리 + 모델 합치기

4단계. 성능 평가 및 하이퍼파라미터 튜닝

학습 개념

주제	설명
분류 평가	정확도, 정밀도, 재현율, F1, ROC-AUC
회귀 평가	MSE, RMSE, MAE, R²
교차검증	`cross_val_score()`
튜닝	`GridSearchCV`, `RandomizedSearchCV`

5단계. 앙상블 & 고급 모델

학습 개념

모델	특징
Random Forest	다수 트리 → 평균
Gradient Boosting	순차적 학습
XGBoost	병렬처리 지원
LightGBM	속도 빠름, 대규모 데이터
Voting, Stacking	모델 결합

기록용 블로그

이전 포스트

Pandas - [9단계] 판다스 성능 최적화

다음 포스트

머신러닝 - [1단계] 머신러닝 핵심 개념 이론 정리

0개의 댓글