#3 머신러닝의 Task

chiro_J·2022년 7월 21일
0

머신러닝 클리닉

목록 보기
3/29
post-thumbnail

기계학습(ML)의 대표적인 3가지 Task 인 Classification(분류)과 Clustering(군집), 그리고 Regression(회귀)에 대해 알아보고자 한다.

Classification (분류)

지도학습(Supervised learning)의 일종.
기존의 데이터들 간의 관계를 파악하여, 새로운 데이터들에 대해 스스로 판단하는 과정.

이진 분류 (Binary classification)

네(Y)/아니오(N), 0과 1, O/X 등의 방식으로 응답할 수 있는 카테고리의 데이터에 이용되는 분류 방법.

< 예시 >
Q : 이 댓글은 스팸인가?
A : True / False

다중 분류 (Multiclass classification)

3개 이상의 출력값으로 응답해야 할 경우의 카테고리에 이용되는 분류 방법.
좋음/보통/나쁨, 1/2/3/4/5 등

< 예시 >
Q : 오늘 수업의 만족도를 평가해주세요. (1~5)
A : 1 / 2 / 3 / 4 / 5

Clustering (군집)

각 데이터들 간의 특징을 분석하여 비슷한 것 끼리 묶는 과정
비지도학습 혹은 준지도학습(지도 + 비지도)을 이용한다.

  • 정답이 없는 데이터를 모델에 따라 비슷한 샘플끼리 묶어주는 머신러닝 알고리즘
  • 데이터에 숨겨진 특징이나 구조를 발견하여 같은 특징에 따라 구분

< 예시 >

  • 호텔을 예약하는 이용자들의 습관과 특성을 기반으로 고객 그룹화

Regression (회귀)

데이터 변수들 간의 함수 관계를 파악하는 것
원인 a → 결과 b 에 대한 평균

  • Linear Regression : 선형으로 표현 가능한 회귀 (다항식의 n차 함수)
  • Logistic Regression : x = 0일 때, 점 대칭인 확률 분포 함수

비교

  • Classification 과 Regression 은 지도학습, Clustering 은 비지도학습에 속함.
    • Classification : 2개 이상의 범주형
    • Regression : 수치형 예측 / 2개의 범주형
    • Clustering : label이 특정 되지 않은 경우에, data 내에서 그룹화

0개의 댓글