반응변수y와 설명변수x의 관계를 봤을 때, x가 0인 경우 y 또한 0이 되는 것이 자연스럽다면 절편을 0으로 설정. 또는 y값이 음수가 나올 수 없을 때 절편이 음수값으로 추정된다면 절편을 0으로 만드는 것이 좋다.
불확실할 경우,
1) 절편을 포함한 회귀분석과 절편이 0인 회귀분석의 결과 중 MSE가 작은 쪽을 선택.
2) 절편을 포함한 분석을 실시했을 때 절편에 대한 p-value값이 작아 절편이 유의하다고 하면 절편을 포함한다.
3) 그러나 절편이 0이라는 강한 이론적 근거가 없다면 절편을 포함하는 것이 좋다.
절편이 있을 경우와 없을 경우, R^2이 다르게 정의된다. (절편이 0인 회귀식에서는 SSE의 자유도가 n-p-1
에서 n-p
으로 바뀌면서 SST = SSR+SSE
의 식이 성립하지 않는다.) 보통은 절편이 0일 때 R^2값이 더 크게 나오고 결정계수가 성능 평가 지표로서 성능을 평가하지 못하므로 절편이 있는 모형의 R^2값과 절편이 0인 모형의 R^2값을 비교하는 것은 적절하지 않다.