ML lec(이론) 4 - Multi-variable Linear Regression

박성재·2020년 12월 4일
0

출처: 모두를 위한 딥러닝 강좌 시즌 1 by Sung Kim

Multi-variable Linear Regression(다중 선형 회귀)

  • 다중 선형 회귀란, 결과값을 예측하는 회귀자(regressor)가 여러 개인 회귀 모형을 말한다.

다중 선형 회귀의 Hypothesis

다중 선형 회귀의 Cost function

Matrix(행렬) 활용

다중 선형 회귀에서 변인(variable)이 많아질수록 이를 수식으로 나열하는 것이 굉장히 복잡해지기 때문에 행렬식을 이용하여 간단히 표현할 수 있다.

  • 위와 같이, 우리의 가설 함수를 행렬의 곱으로 나타낼 수 있다.
  • 행렬은 대문자로 나타낸다.
  • 회귀식으로 일일이 표현할 때는 wx로 썼지만, 행렬식으로 표현할 때는 XW 와 같이 쓴다.

한편, 데이터는 단 하나의 사례(instance)가 아닌, 수많은 사례들로 이루어져 있다.
각각의 instance에 대해서 행렬식을 따로 세워 계산하는 것은 효율적이지 못하다.
다음과 같이 하나의 행렬식에서 모든 instance 들을 고려할 수 있다.

이처럼 행렬식을 이용하면 복잡한 식을 간단히 표현할 수 있다는 장점이 있다.

다중 선형 회귀 행렬식의 구조

  • [instance 수, variable(feature) 수] \cdot [variable 수, 출력 수] = [instance 수, 출력 수]
  • 참고로, 하나의 instance에 대한 출력이 1개일 필요는 없으며, 이 때에도 위의 구조가 그대로 유지된다.

0개의 댓글