🌟통계량의 범위와 해석
상관계수 r (= 직선)
x > y
: 숫자 > 숫자
- 범위: -1 ~ 1
- 해석:
-1이나 1
에 가까울수록 강한 상관관계, 0에 가까울수록 약한 상관관계
- 시각화: 산점도 (scatterplot)
t 통계량 (= 두 평균의 차이)
x > y
: 범주 > 숫자
- 범위: -∞ ~ ∞
- 해석:
< -2
, 혹은 2 <
일 때 상관관계가 높은 편
- 시각화: 평균 비교용 막대 그래프 (sns.barplot)
분산분석 (ANOVA) f 통계량 (= 전체 평균 vs 개별 평균)
x > y
: 범주 > 숫자
- 범위: 0 ~ ∞
- 해석: 2~3보다 크면 상관관계가 높은 편
- 시각화: 평균 비교용 막대 그래프 (sns.barplot)
카이제곱 f 통계량 (
x > y
: 범주 > 범주
- 범위: 0 ~ ∞
- 해석: 자유도의 약 2배보다 크면 상관관계가 높은 편
- 시각화: 모자익 플롯 (mosaicplot)
범주 > 범주
시각화
→ kde plot (밀도 그래프), histogram (히스토그램)