R squared 설명

기린이·2023년 7월 17일
0

통계지식

목록 보기
13/18

R squared는 회귀모델의 설명력을 나타내는 지표.

R2=SSRSSTR^2 = \frac{SSR}{SST} 이다.

우리가 가장 쉽게 생각할 수 있는 회귀식은 y=yˉy=\bar{y}이다. 이런 엉망인 회귀식일때의 오차와 데이터 학습해서 만든 회귀식의 오차를 비교해서 얼마나 개선됐는지 파악하는 것이 R squared 지표이다.

즉 찾아낸 회귀선이 얼마나 Residual을 줄였냐와 같은 말

데이터를 평균치로 예측한다했을때 오차 -> SST = (yyˉ)2(y-\bar{y})^2

회귀식으로 예측했을때 오차 -> SSE = (yy^)2(y-\hat{y})^2

평균치로 예측한 오차 - 회귀식으로 예측한 오차 -> SSR = (yˉy^)2(\bar{y}-\hat{y})^2

SST = SSR + SSE

결정계수값이 1에 가까울수록 좋은 설명력을 가진다.

회귀변수, 데이터가 많을수록 높은 결정계수값을 가지게 되므로 Adj R squared값을 쓰기도 한다.

Radjusted 2=1(1R2)(n1)nk1R_{\text {adjusted }}^2=1-\frac{\left(1-R^2\right)(n-1)}{n-k-1}

참고

https://recipesds.tistory.com/entry/%ED%9A%8C%EA%B7%80%EB%B6%84%EC%84%9D-%EA%B2%B0%EA%B3%BC%EC%9D%98-%ED%95%B4%EC%84%9D%EA%B3%BC-R%C2%B2%EC%84%A4%EB%AA%85%EB%A0%A5%EC%9D%98-%EC%9D%98%EB%AF%B8-%EA%B7%B8%EB%A6%AC%EA%B3%A0-R%EC%9D%80-%EC%83%81%EA%B4%80%EA%B3%84%EC%88%98%EC%9D%98-%EC%A0%9C%EA%B3%B1-%EC%9D%91

profile
중요한 것은 속력이 아니라 방향성, 공부하며 메모를 남기는 공간입니다.

0개의 댓글