데이터 값은 평균과 같은 일정한 값으로 돌아가려는 경향성을 이용
기본적으로 선형이라는 전제하에 점들을 가장 잘 설명하는 직선을 찾고 경향성을 설명
종속변수와 독립변수 간에 선형관계가 존재하는지 알 수 있음
독립변수의 종속변수에 대한 유의성과 영향력의 정도를 알 수 있음.
추정된 회귀모형을 통해 종속변수의 예측치를 알 수 있음
SST = SSR + SSE
: 잔차의 제곱합을 최소화하는 방법으로 회귀계수 추정
: SSE가 작을수록 분석을 잘한 것
잔차 (Residual)
: 예측값 - 실제값
수정된 결정계수
: 독립변수 개수가 많아질수록 커지는 결정계수의 단점을 보완해 표본의 크기와 독립변수의 수를 고려
과적합(Overfit)
: 복잡하고 데이터가 적을수록 다수 발생