[ML] - Regression vs Classification (회귀, 분류)

서현이의 개발 기록장·2022년 11월 8일
0

ML

목록 보기
4/7
post-thumbnail
post-custom-banner

머신러닝 학습 방법 중 지도학습에서 인공지능이 두 가지 종류의 문제를 해결하는데, 분류와 회귀 분석을 통한 해결이다.

Regression (회귀)

연속된 값을 예측 하는 것

독립 변수와 종속 변수 간의 상관 관계가 존재한다.
회귀 분석은 독립 변수가 종속 변수에 얼마나 영향을 미치는지 알아보고, 이를 통해 응용하며 분석하는 방법이다.

  • 독립 변수 : 독립적으로 존재하는 데이터 변수 X 를 의미한다.
  • 종속 변수 : 독립 변수가 변함에 따라, 영향을 받아 같이 변하는 데이터 변수 Y 를 의미한다.
  • 상관관계 : 독립 변수와 종속 변수가 서로(둘 이상) 간의 얼마나 관련이 있는가를 의미한다.

쉽게 말하면 임의의 변수들이 서로 영향을 미치는데, 이를 가지고 우리가 원하는 값을 예측하는 방법이다.

< 회귀 종류 >
선형 회귀(Linear regression) ...
로지스틱 회귀(Logistic regression) ...
리지 회귀(Ridge regression) ...
라쏘 회귀(Lasso regression) ...
다항 회귀(Polynomial regression) ...


Classification (분류)

비연속적인 범주형 값을 분류하는 것

Binary Classification(이진 분류)

  • Class가 O, X 와 같이 두가지로 나뉘는 문제를 해결할 때 이진분류가 사용된다.
  • 인공지능 모델의 출력층의 노드 개수가 2개로, 2가지의 결과만 출력한다.

예) 위에 사진에서도 알 수 있듯이, 스팸인지 아닌지 분류하는 문제는 '이메일이 스팸이다 아니다' 2가지 클래스 중 하나로 표현되기 때문에 이진분류이다.


Multi-Class Classification (다중 분류)

  • Class가 두개가 아닌 여러개인 문제를 해결할 때 다중 분류가 사용된다.
  • 하나의 사진에 하나의 클래스를 부여한다.
  • 인공지능 모델의 출력층의 노드 개수가 여러개로, 여러개 중 하나의 클래스를 출력한다.

예) 위에 사진에서도 알 수 있듯이, '개인지 고양이인지 말인지 등 동물의 종류를 분류'하는 문제는 정답 클래스가 어려개 중 하나로 표현되기 때문에 다중 분류이다.


Multi-Label Classification (다중 레이블 분류)

  • 하나의 사진에 하나의 클래스를 부여하는 것이 아니라, 하나의 사진에 여러개의 클래스를 부여한다.
  • 한 사진에 여러 종류의 클래스가 있을 때 여러개의 클래스를 동시에 표현한다.
  • 하나의 클래스가 같은 사진에서 두번 나올 수도 있다.

예) 위에 사진에서도 알 수 있듯이, 하나의 사진에서 여러개의 클래스가 존재할 때 이를 모두 표현해야하지 때문에 출력층이 여러개이다. 즉 정답 클래스가 어려개 중 해당 되는 것 모두를 표현되기 때문에 다중 레이블 분류이다.

profile
HanYang ERICA Univ. Department of Artificial Intelligence
post-custom-banner

0개의 댓글