피어슨 상관계수

김요한·2024년 8월 5일

통계학

목록 보기
22/30
post-thumbnail

피어슨 상관계수

  • 가장 대표적으로 많이 사용하는 상관계수

  • 가장 왼쪽 그래프가 피어슨 상관계수 그래프
  • 첫 번째 그래프는 파란 점들로 나타내며, x와 y의 선형 관계를 보여줌.
  • 그래프에서 점들이 직선으로 퍼져 있고, 상관계수는 0.99로 매우 강한 양의 선형 관계를 나타냄.

피어슨 상관계수

  • 두 연속형 변수 간의 선형 관계를 측정하는 지표
  • -1에서 1 사이의 값을 가짐
  • 1은 완전한 양의 선형 관계
  • -1은 완전한 음의 선형 관계
  • 0은 선현관계가 없음을 의미

피어슨 상관계수는 언제 사용할까

선형적인 관계가 예상 될 때

  • 공부 시간과 시험 점수 간의 상관관계 분석.
  • 비선형 관계에선 사용할 수 없음

    피어슨 상관계수 1 ~ -1 시각화

from scipy.stats import spearmanr, kendalltau

# 예시 데이터 생성
np.random.seed(0)
customer_satisfaction = np.random.rand(100)
repurchase_intent = 3 * customer_satisfaction + np.random.randn(100) * 0.5

# 데이터프레임 생성
df = pd.DataFrame({'CustomerSatisfaction':customer_satisfaction, 
'Repurchase Intent': repurchase_intent})

# 스피어만 상관계수 계산
spearman_corr, _ = spearmanr(df['Customer Satisfaction'],
df['Repurchase Intent'])
print(f"스피어만 상관계수: {spearman_corr}")

# 켄달의 타우 상관계수 계산
kendall_corr, _ = kendalltau(df['Customer Satisfaction'], 
df['Repurchase Intent'])
print(f"켄달의 타우 상관계수: {kendall_corr}")

# 상관관계 히트맵 시각화
sns.heatmap(df.corr(method='spearman'), annot=True, cmap='coolwarm'
, vmin=-1, vmax=1)
plt.title('spearman coefficient heatmap')
plt.show()

0개의 댓글