공분산, 상관계수, 결정계수

JiWOn·2023년 1월 5일
0

🦁멋쟁이 사자처럼 AI School 8기 강의
👩‍💻 박두진 강사님 강의 4일차 (2023.1.5)

공분산(Covariance)

두 데이터가 분산되어 있는 방향을 보여줌
2개의 확률 변수의 상관정도

  • 평균 편차곱
  • 방향성을 보여줄 순 있으나 강도를 나타내는데 한계가 있다

cov = i=1n(xixˉ)(yiyˉ)n\sum_{i=1}^{n}{(x_i-\bar{x})(y_i-\bar{y})}\over n, xˉ:x\bar{x}:x의 평균, yˉ=y\bar y = y의 평균

코드는 나만 보기..

상관계수(Correlation coefficent)

공분산 한계를 극복함
x분산과 y분산을 곱한 결과의 제곱근을 나눠주면 x나 y의 변화량이 클수록 0에 가까워짐

  • 1과 가까울수록 강한 양의 상관관계
  • -1과 가까울수록 강한 음의 상관관계
  • 0과 가까울수록 관계가 없어짐

r=r = (xxˉ)(yyˉ)(xxˉ)2(yyˉ)2\sum {(x-\bar{x})(y-\bar{y})} \over \sqrt{\sum{(x-\bar{x})^2 (y-\bar{y})^2}}

즉 공분산 / 제곱근(x분산×\timesy분산)

결정계수(Coefficient of determination : R-squared)

x로부터 y를 예측할 수 있는 정도

  • 상관계수의 제곱(상관계수를 양수화)
  • 수치가 클수록 회귀분석을 통해 예측할 수 있는 수치의 정도가 정확

정리

방향성강도
공분산OX
상관계수OO
결정계수XO

0개의 댓글