[ML Basic] ML 방법론의 분류

ARK_dvlp·2025년 9월 5일

커널 아카데미 16기

목록 보기
6/17

📌 Supervision과 지도학습 정리

1. Supervision

  • 정의: 입력 데이터 x에 대해 사람이 직접 정답 라벨 y를 지정해주는 것.
  • 예시:
    • 사진(x) → 고양이/강아지(y)
    • 환자 데이터(x) → 질병 유무(y)

2. 지도학습 (Supervised Learning)

  • 정의: 입력값 x로부터 출력값 y를 예측할 수 있도록 함수 f(x)를 학습하는 방식.
  • 목표: 모델의 예측값이 실제 라벨에 가까워지도록 최적화.

3. 회귀모델 (Regression)

  • 종속변수 y: 연속형 변수
  • 예시
    • 집값 예측 (방 개수, 면적, 위치 → 가격)
    • 기온, 강수량 예측

대표적 방법론

  • 선형회귀 (Linear Regression): 단순 선형 모델 f(x) = ax + b
  • 상관관계 분석: 입력과 출력이 얼마나 선형적으로 관련 있는지 평가

4. 분류모델 (Classification)

  • 종속변수 y: 범주형 / 이산형 변수
  • 예시
    • 스팸메일 여부 (스팸 / 정상)
    • 손글씨 숫자 인식 (0~9)

방법론

  • 로지스틱 회귀 (Logistic Regression)
    • 확률 모델링 → P(y=1|x) 계산
    • 시그모이드(이진 분류), 소프트맥스(다중 분류) 확장
  • 그 외 분류 기법
    • k-최근접이웃(KNN)
    • 결정트리(Decision Tree)
    • 서포트 벡터머신(SVM)

5. 비지도학습 (Unsupervised Learning)

  • 정의: 라벨이 없는 데이터에서 패턴/구조를 발견하는 학습 방식
  • 왜 필요한가?
    • 라벨링 비용 절감
    • 매니폴드 가설: 데이터는 고차원 공간에 흩어져 있지만, 실제로는 저차원의 구조(매니폴드)에 놓여 있음

방법론

  • 차원축소 (Dimensionality Reduction)
    • PCA (주성분 분석)
    • t-SNE (비선형 시각화)
  • 군집화 (Clustering)
    • K-Means
    • 계층적 군집화

0개의 댓글