[스터디] 변수 간 상관 관계 분석을 위한 통계량의 범위와 해석

­chae-zero·2023년 2월 28일
0

🌟통계량의 범위와 해석

상관계수 r (= 직선)

  • x > y : 숫자 > 숫자
  • 범위: -1 ~ 1
  • 해석: -1이나 1에 가까울수록 강한 상관관계, 0에 가까울수록 약한 상관관계
  • 시각화: 산점도 (scatterplot)

t 통계량 (= 두 평균의 차이)

  • x > y : 범주 > 숫자
  • 범위: -∞ ~ ∞
  • 해석: < -2, 혹은 2 < 일 때 상관관계가 높은 편
  • 시각화: 평균 비교용 막대 그래프 (sns.barplot)

분산분석 (ANOVA) f 통계량 (= 전체 평균 vs 개별 평균)

  • x > y : 범주 > 숫자
  • 범위: 0 ~ ∞
  • 해석: 2~3보다 크면 상관관계가 높은 편
  • 시각화: 평균 비교용 막대 그래프 (sns.barplot)

카이제곱 f 통계량 (

  • x > y : 범주 > 범주
  • 범위: 0 ~ ∞
  • 해석: 자유도의 약 2배보다 크면 상관관계가 높은 편
  • 시각화: 모자익 플롯 (mosaicplot)

범주 > 범주 시각화

kde plot (밀도 그래프), histogram (히스토그램)

profile
사람 재미를 아는 길잡이가 될래요

0개의 댓글