📌 Supervision과 지도학습 정리
1. Supervision
- 정의: 입력 데이터
x에 대해 사람이 직접 정답 라벨 y를 지정해주는 것.
- 예시:
- 사진(
x) → 고양이/강아지(y)
- 환자 데이터(
x) → 질병 유무(y)
2. 지도학습 (Supervised Learning)
- 정의: 입력값
x로부터 출력값 y를 예측할 수 있도록 함수 f(x)를 학습하는 방식.
- 목표: 모델의 예측값이 실제 라벨에 가까워지도록 최적화.
3. 회귀모델 (Regression)
- 종속변수
y: 연속형 변수
- 예시
- 집값 예측 (방 개수, 면적, 위치 → 가격)
- 기온, 강수량 예측
대표적 방법론
- 선형회귀 (Linear Regression): 단순 선형 모델
f(x) = ax + b
- 상관관계 분석: 입력과 출력이 얼마나 선형적으로 관련 있는지 평가
4. 분류모델 (Classification)
- 종속변수
y: 범주형 / 이산형 변수
- 예시
- 스팸메일 여부 (스팸 / 정상)
- 손글씨 숫자 인식 (0~9)
방법론
- 로지스틱 회귀 (Logistic Regression)
- 확률 모델링 →
P(y=1|x) 계산
- 시그모이드(이진 분류), 소프트맥스(다중 분류) 확장
- 그 외 분류 기법
- k-최근접이웃(KNN)
- 결정트리(Decision Tree)
- 서포트 벡터머신(SVM)
5. 비지도학습 (Unsupervised Learning)
- 정의: 라벨이 없는 데이터에서 패턴/구조를 발견하는 학습 방식
- 왜 필요한가?
- 라벨링 비용 절감
- 매니폴드 가설: 데이터는 고차원 공간에 흩어져 있지만, 실제로는 저차원의 구조(매니폴드)에 놓여 있음
방법론
- 차원축소 (Dimensionality Reduction)
- PCA (주성분 분석)
- t-SNE (비선형 시각화)
- 군집화 (Clustering)