다중 선형회귀 (Multiple Linear Regression)

강승구·2023년 1월 26일
0

다중 선형 회귀(Multiple Linear Regression, MLR)는 여러 개의 독립 변수와 하나의 종속 변수의 선형 관계를 모델링하는 것이다.

기본적인 원리는 단순 선형 회귀와 비슷하지만 차이점이라면 종속변수의 개수가 2개 이상이므로 회귀 방정식에 차이가 있다.

단순 선형회귀에서의 회귀 방정식은 y=b0+b1xy=b_{0} + b_{1}x 로 표현할 수 있다.
다중 선형회귀에서는 종속변수가 여러개이므로 y=β0+β1x1+β2x2++βnxny=\beta_{0}+\beta_{1}x1+\beta_{2}x_{2}+\cdots+\beta_{n}x_{n}로 표현할 수 있다.

선형 회귀에서의 가정이나 최소제곱법을 이용하여 성능 척도값을 구하는 등의 특징은 단순 선형 회귀와 동일하다.

다중공선성

다중 선형 회귀에서는 특성의 개수가 2개 이상이므로 다중공선성(Multicollinearity)을 주의해야한다.

다중공선성이란 어떤 독립변수가 다른 독립변수들과 완벽하게 선형독립성을 이루지 않는 경우를 말한다. 즉 모델의 일부 변수가 다른 변수들과 상관관계가 높아 영향을 미치는 현상이다.

이러한 문제가 존재한다면

profile
강승구

0개의 댓글