Appendix. 상관계수와 상관관계

dpwl·2024년 6월 23일

Data Analysis with Python

목록 보기
24/48

1. 상관관계

DataFrame.corr(method='pearson')

pandas의 상관계수는 'pearson', 'kendall', 'spearman' 세가지 알고리즘을 선택할 수 있다.

default로 피어슨 상관계수를 사용한다.

1.1 피어슨 상관계수 공식

분자는 x, y 각각의 값이 평균에 비해서 어느 정도인지를 곱해준다. 즉, 특정 x의 값이 평균 X의 값보다 클 때 y도 함께 커진다면 +, 작아진다면 -의 값을 갖는 것을 의미한다.

분모는 x, y의 평균이 커져도 정규화 하는 과정이다. 그렇기 때문에 어떤 통계던 -1에서 1까지의 값을 가진다.

1.1.1 높은 양의 상관관계

1.1.2 상관관계 없음

1.1.3 높은 음의 상관관계

profile
거북선통통통통

0개의 댓글