열심히라도해라

열심히라도해라

[ML Basic] ML 방법론의 분류

ARK_dvlp·2025년 9월 5일

커널 아카데미 16기

목록 보기

6/17

📌 Supervision과 지도학습 정리

1. Supervision

정의: 입력 데이터 x에 대해 사람이 직접 정답 라벨 y를 지정해주는 것.
예시:
- 사진(x) → 고양이/강아지(y)
- 환자 데이터(x) → 질병 유무(y)

2. 지도학습 (Supervised Learning)

정의: 입력값 x로부터 출력값 y를 예측할 수 있도록 함수 f(x)를 학습하는 방식.
목표: 모델의 예측값이 실제 라벨에 가까워지도록 최적화.

3. 회귀모델 (Regression)

종속변수 y: 연속형 변수
예시
- 집값 예측 (방 개수, 면적, 위치 → 가격)
- 기온, 강수량 예측

대표적 방법론

선형회귀 (Linear Regression): 단순 선형 모델 f(x) = ax + b
상관관계 분석: 입력과 출력이 얼마나 선형적으로 관련 있는지 평가

4. 분류모델 (Classification)

종속변수 y: 범주형 / 이산형 변수
예시
- 스팸메일 여부 (스팸 / 정상)
- 손글씨 숫자 인식 (0~9)

방법론

로지스틱 회귀 (Logistic Regression)
- 확률 모델링 → P(y=1|x) 계산
- 시그모이드(이진 분류), 소프트맥스(다중 분류) 확장
그 외 분류 기법
- k-최근접이웃(KNN)
- 결정트리(Decision Tree)
- 서포트 벡터머신(SVM)

5. 비지도학습 (Unsupervised Learning)

정의: 라벨이 없는 데이터에서 패턴/구조를 발견하는 학습 방식
왜 필요한가?
- 라벨링 비용 절감
- 매니폴드 가설: 데이터는 고차원 공간에 흩어져 있지만, 실제로는 저차원의 구조(매니폴드)에 놓여 있음

방법론

차원축소 (Dimensionality Reduction)
- PCA (주성분 분석)
- t-SNE (비선형 시각화)
군집화 (Clustering)
- K-Means
- 계층적 군집화

이전 포스트

[ML Basic] 데이터의 품질과 EDA

다음 포스트

[ML Basic] 회귀 모델의 정의와 개념 소개

0개의 댓글