예) user당 gmv는 t검정이고 cvr은 카이제곱 검정
User당 GMV (t-검정):
CVR (카이제곱 검정):
주요 차이점:
데이터 유형:
측정 대상:
통계적 가정:
검정의 성격:
이러한 차이로 인해 각 지표에 적합한 검정 방법이 다릅니다. 그러나 상황에 따라 다른 검정 방법을 사용할 수도 있습니다. 예를 들어, GMV 데이터가 정규 분포를 따르지 않는 경우 비모수적 방법인 Mann-Whitney U 검정을 사용할 수 있고, CVR의 경우 샘플 크기가 작다면 Fisher의 정확 검정을 사용할 수 있습니다.
샘플 데이터를 활용한 예시
샘플 테이블:
| Group | User1 | User2 | User3 | User4 | User5 | ... | User20 |
|-------|-------|-------|-------|-------|-------|-----|--------|
| A | 100 | 0 | 150 | 50 | 200 | ... | 75 |
| B | 120 | 0 | 180 | 60 | 220 | ... | 90 |
계산 과정:
1) 각 그룹의 평균(μ) 및 표준편차(s) 계산
Group A: μA = 85, sA = 70
Group B: μB = 100, sB = 80
2) t-통계량 계산:
t = (μB - μA) / √(sA²/nA + sB²/nB)
여기서 nA와 nB는 각 그룹의 샘플 크기 (여기서는 20)
t = (100 - 85) / √(70²/20 + 80²/20) = 0.6124
3) 자유도 계산:
df = (sA²/nA + sB²/nB)² / [(sA²/nA)²/(nA-1) + (sB²/nB)²/(nB-1)]
df ≈ 37
4) p-value 계산:
t-분포표를 이용하여 자유도 37, t-값 0.6124에 해당하는 p-value 찾기
p-value ≈ 0.5437
결론: p-value > 0.05이므로, 두 그룹의 평균 GMV 차이는 통계적으로 유의미하지 않습니다.
샘플 테이블:
| Group | 전환 | 비전환 | 총 사용자 |
|-------|------|--------|-----------|
| A | 30 | 170 | 200 |
| B | 45 | 155 | 200 |
| 총합 | 75 | 325 | 400 |
계산 과정:
1) 기대빈도 계산:
EA(전환) = (200 75) / 400 = 37.5
EA(비전환) = (200 325) / 400 = 162.5
EB(전환) = (200 75) / 400 = 37.5
EB(비전환) = (200 325) / 400 = 162.5
2) 카이제곱 통계량 계산:
χ² = Σ [(O - E)² / E]
χ² = (30 - 37.5)² / 37.5 + (170 - 162.5)² / 162.5 +
(45 - 37.5)² / 37.5 + (155 - 162.5)² / 162.5
χ² = 3.8095
3) 자유도 계산:
df = (행 수 - 1) (열 수 - 1) = (2 - 1) (2 - 1) = 1
4) p-value 계산:
카이제곱 분포표를 이용하여 자유도 1, χ²값 3.8095에 해당하는 p-value 찾기
p-value ≈ 0.0509
결론: p-value가 0.05에 매우 근접하지만 약간 크므로, 두 그룹의 CVR 차이는 통계적으로 유의미하지 않습니다 (5% 유의수준 기준). 그러나 10% 유의수준에서는 유의미할 수 있습니다.
주요 차이점:
1. 데이터 형태:
검정 통계량:
자유도 계산 방식:
가정:
이러한 차이로 인해 각 지표에 적합한 검정 방법이 다르며, 결과 해석 시 이를 고려해야 합니다.