지도 학습 vs 비지도 학습 정리
머신러닝은 크게 지도 학습(Supervised Learning)과 비지도 학습(Unsupervised Learning)으로 나뉜다.
이 둘의 차이는 정답(label)의 유무에 있다.
1. 지도 학습 (Supervised Learning)
정답(label)이 있는 데이터를 학습하여 결과를 예측하는 방식
1) 분류 (Classification)
데이터를 특정 카테고리로 나누는 문제
- Logistic Regression
- Decision Tree (Classifier)
- Random Forest (Classifier)
- Support Vector Machine (SVM)
- K-Nearest Neighbors (KNN)
- Naive Bayes
- Neural Network (DNN, CNN 등)
2) 회귀 (Regression)
연속적인 값을 예측하는 문제
- Linear Regression
- Polynomial Regression
- Ridge / Lasso Regression
- Decision Tree (Regressor)
- Random Forest (Regressor)
- Support Vector Regression (SVR)
3) 기타 (고급 기법)
성능을 높이기 위한 방법들
- Gradient Boosting (XGBoost, LightGBM, CatBoost)
- Ensemble Learning (Bagging, Boosting, Stacking)
2. 비지도 학습 (Unsupervised Learning)
정답 없이 데이터의 구조나 패턴을 찾는 방식
1) 군집화 (Clustering)
비슷한 데이터끼리 그룹을 만드는 방법
- K-Means
- Hierarchical Clustering
- DBSCAN
- Gaussian Mixture Model (GMM)
2) 차원 축소 (Dimensionality Reduction)
데이터의 특징을 줄이면서 중요한 정보만 남기는 방법
- PCA (Principal Component Analysis)
- t-SNE
- UMAP
3) 밀도 추정 / 분포 모델링
데이터의 분포를 추정하는 방법
- Kernel Density Estimation (KDE)
- Gaussian Mixture Model (GMM)
4) 연관 규칙 학습 (Association Rule Learning)
데이터 간의 관계를 찾는 방법
- Apriori Algorithm
- FP-Growth
5) 이상 탐지 (Anomaly Detection)
정상과 다른 특이 데이터를 찾는 방법
- Isolation Forest
- One-Class SVM
- Local Outlier Factor (LOF)
3. 한눈에 비교
| 구분 | 지도 학습 | 비지도 학습 |
|---|
| 데이터 | 정답 있음 | 정답 없음 |
| 목적 | 예측 | 패턴 발견 |
| 대표 문제 | 분류, 회귀 | 군집, 차원 축소 |
4. 직관적으로 이해하기
- 지도 학습: 문제와 정답을 같이 학습하는 방식
- 비지도 학습: 정답 없이 데이터의 규칙을 스스로 찾는 방식
5. 핵심 정리
- 지도 학습은 정확한 예측이 목표
- 비지도 학습은 데이터 구조 이해가 핵심
- 실무에서는 두 방법을 함께 사용하는 경우가 많다