🦁멋쟁이 사자처럼 AI School 8기 강의
👩💻 박두진 강사님 강의 4일차 (2023.1.5)
공분산(Covariance)
두 데이터가 분산되어 있는 방향을 보여줌
2개의 확률 변수의 상관정도
- 평균 편차곱
- 방향성을 보여줄 순 있으나 강도를 나타내는데 한계가 있다
cov = n∑i=1n(xi−xˉ)(yi−yˉ), xˉ:x의 평균, yˉ=y의 평균
코드는 나만 보기..
상관계수(Correlation coefficent)
공분산 한계를 극복함
x분산과 y분산을 곱한 결과의 제곱근을 나눠주면 x나 y의 변화량이 클수록 0에 가까워짐
- 1과 가까울수록 강한 양의 상관관계
- -1과 가까울수록 강한 음의 상관관계
- 0과 가까울수록 관계가 없어짐
r= ∑(x−xˉ)2(y−yˉ)2∑(x−xˉ)(y−yˉ)
즉 공분산 / 제곱근(x분산×y분산)
결정계수(Coefficient of determination : R-squared)
x로부터 y를 예측할 수 있는 정도
- 상관계수의 제곱(상관계수를 양수화)
- 수치가 클수록 회귀분석을 통해 예측할 수 있는 수치의 정도가 정확
정리