기계학습(ML)의 대표적인 3가지 Task 인 Classification(분류)과 Clustering(군집), 그리고 Regression(회귀)에 대해 알아보고자 한다.
Classification (분류)
지도학습(Supervised learning)의 일종.
기존의 데이터들 간의 관계를 파악하여, 새로운 데이터들에 대해 스스로 판단하는 과정.
네(Y)/아니오(N), 0과 1, O/X 등의 방식으로 응답할 수 있는 카테고리의 데이터에 이용되는 분류 방법.
< 예시 >
Q : 이 댓글은 스팸인가?
A : True / False
3개 이상의 출력값으로 응답해야 할 경우의 카테고리에 이용되는 분류 방법.
좋음/보통/나쁨, 1/2/3/4/5 등
< 예시 >
Q : 오늘 수업의 만족도를 평가해주세요. (1~5)
A : 1 / 2 / 3 / 4 / 5
Clustering (군집)
각 데이터들 간의 특징을 분석하여 비슷한 것 끼리 묶는 과정
비지도학습 혹은 준지도학습(지도 + 비지도)을 이용한다.
< 예시 >
Regression (회귀)
데이터 변수들 간의 함수 관계를 파악하는 것
원인 a → 결과 b 에 대한 평균
비교