회귀분석 - 회귀진단

yoonene·2022년 1월 26일
0

회귀진단 (Regression Diagnostics)

회귀모형의 가정

  1. 독립변수와 종속변수 간 선형성 (Linearity)
  2. 오차의 정규성 (Normality)
  3. 오차의 등분산성 (Homoscedasticity)
  4. 오차의 독립성 (Independence)

1. 선형성 (Linearity)

  • 독립변수와 종속변수 간 산점도를 통해 선형성 판단
  • 첫 번째 그림은 x1과 y1이 선형 관계이지만, 두 번째 그림의 x2와 y2는 선형 관계가 존재하지 않는다.

2. 오차의 정규성 (Normality)

  • 오차가 정규분포를 따라야 함
  • 잔차의 히스토그램을 통해 정규성 판단
  • 위 그림에서 e1은 정규성 가정을 만족, e2는 위배한다고 추정할 수 있다
  • shakiro-Wilk Normality Test를 통해 정규성 판단

3. 오차의 등분산성 (Homoscedasticity)

  • 위 그림의 경우, band width는 점점 커지는 이분산이기 때문에 등분산성에 위배된다.
  • 독립변수에 대한 잔차 그림을 통해 등분산성 판단

4. 독립성 (Independence)

  • 독립변수와의 상관관계, 자기상관관계를 통해 독립성 판단
  • 잔차에 패턴이 존재한다면 독립적이지 않다.
  • Durbin-Watson 검정, ACF 검정을 통해 독립성 판단
  • 위 그림의 경우 a를 제외한 나머지 그래프는 패턴을 가지므로 독립적이라 하기 어렵다.
profile
NLP Researcher / Information Retrieval / Search

2개의 댓글

comment-user-thumbnail
2022년 1월 27일

1번에 나온 선형성에서 Linear Regression으로 비선형을 예측하는 방법으로는 polynomial regression 이 있습니다. 어떻게 비선형을 예측할 수 있는지 더 찾아보면 좋을 것 같습니다.

1개의 답글