통계학 기초 05 상관관계
5.1 피어슨 상관계수
- 두 연속성 변수 간의 선형 관계를 측정하는 지표
- -1에서 1사이의 값
- 1은 완전한 양의 상관 관계
- -1은 완전한 음의 상관 관계
- 0은 선형 관계가 없음
5.2 비모수 상관계수
- 스피어만 상관계수
- X와 Y의 순위 관계를 보여줌
- -1에서 1사이로 해석
- 데이터가 정규분포를 따르지 않거나 변수들이 순서형 데이터를 사용할 때 상관
데이터의 분포에 대한 가정 없이 두 변수 간의 상관관계를 측정할 때 사용
가. 스피어만 상관계수
- 두 변수의 순위 간일 일관성을 측정
- 켄달의 타우 상관계수 보다 데이터 내 에러에 민감
나. 켄달의 타우 상관계수
- 순위 간의 일치 쌍 및 불일치 쌍의 비율을 바탕으로 계산
데이터의 분포에 대한 가정을 하지 못할 때
순서형 데이터에서도 사용하고 싶을 때
5.3 상호정보 상관계수
가. 상호정보 상관계수
- 두 변수 간의 상호 정보를 측정
- 변수 간의 정보 의존성을 바탕으로 비선형 관계를 탐지
- 서로의 정보에 대한 불확실성을 줄이는 정도를 바탕으로 계산
- 범주형 데이터에 대해서도 적용 가능
- 상호정보 상관계수를 그림으로 확인해보기