y : 종속 변수
W : 가중치
x : 독립 변수
b : 편향
이 다중 선형회귀를 잘 활용한 데이터 예제가 바로 '주택 가격'이다.
우리가 부동산의 가격을 알아보고자 할 때, 여러가지의 고려 사항을 다 따지면서 가격을 매길 것이다.
예를 들면, 역세권, 남향 여부, 층, 방의 개수 등의 수 많은 요소를 고려하여 매매 가격을 예측 혹은 평가하는 것을 떠올리면 쉽다.
다중 공선성 (Multicollinearity)
다중공선성은 일부 설명 변수가 다른 설명 변수와 상관관계 정도가 높아 회귀 분석 시, 부정적인 영향을 미치는 현상이다.
독립변수 사이의 강한 상관관계 때문에 독립변수가 종속변수를 설명하는 변동성이 겹쳐서 다중공선성이 발생한다.
다중회귀분석에서는 독립변수가 여러 개가 있는데, 다수의 독립변수가 서로 지나치게 높은 상관계수(r>0.9)를 가지면서 회귀계수 추정에 오류가 발생하는 문제를 다중공선성 문제라고 한다.