이번에는 변수의 다중공선성을 확인하는 방법 중 하나인 VIF(Variance Inflation Factors, 분산팽창요인)에대해 알아 보겠습니다. 👋
VIF는 변수간의 다중공선성을 진단하는 수치이며 범위 1부터 무한대입니다.
통계학에서는 VIF 값이 10이상이면 해당 변수가 다중공선성이 잇는 것으로 판단 합니다.
VIF를 구하는 수식은 VIFk = 1 / (1 - Rj2) 입니다.
여기서 VIFk 는 k번째 변수의 VIF 값을 의미하고, Rj2 는 회귀분석에서 사용하는 결정계수 입니다.