이상적인 값으로는 모든 점들이 를 만족하고 한 직선위에 있는 것이지만 실제 값들은 모두 직선위에 있지 못하고 벗어나게 된다. 따라서 실측값에 대한 방정식은 으로 여기서 은 오차항을 나타낸다 이를 독립적인 확률변수처럼 생각할 수 있는데 ~으로 나타낼 수 있다.
많은 사람들이 혼동하여 사용하는 개념이다. 실제로 큰 차이는 없지만 다만 집단이 모집단이냐 표본이냐에 따라 다르게 사용한다.
회귀분석은 기본적으로 모집단 내에서의 변수 의 관계를 알기위해 사용한다. 즉 평균과 같이 모회귀선을 찾는 것을 목표로 한다.
하지만 늘 그렇듯 불가능 하기에 표본집단을 이용하여 추정하게 되는데 이때의 추정치가 위에서 구한 이 되는 것이다.
맨 위에서 나온 의 경우 모회귀선의 값()과 관측값() 사이의 관계를 나타내므로 오차라고 부르고 추정치인 와 관측값()사이의 차이를 잔차라고 부른며 로 표시한다.
쉽게말해 오차의 추정치를 잔차라고 부른다.
= MSE(평균제곱오차)
1. 선형성 : 의 평균은 0
등분산성 : 의 분산은 으로 일정
정규성 : 은 정규분포 ~을 따름
독립성 : 들은 서로 독립