비모수(Nonparametric) 검정
정규성/등분산 가정이 불확실하거나, 이상치가 많고/서열형(순서형) 자료일 때 유용한 분포-자유(distribution-free) 방법들을 정리했습니다. 각 검정은 대응되는 모수검정( t-test / ANOVA )의 대안입니다.
0. 언제 비모수 검정을 쓰나?
- 데이터가 정규분포를 따르지 않음(강한 왜도/두꺼운 꼬리/다봉형)
- 집단 간 분산·분포 모양이 다름(이분산/비대칭)
- 이상치의 영향이 큼
- 서열형(ordinal) 척도
- 표본수가 매우 작아 정규성 검정 신뢰가 낮음
표본이 충분히 크면 모수검정(Welch t 등)도 꽤 견고합니다. 다만 효과크기와 신뢰구간을 함께 보고, 민감한 경우 비모수 검정으로 교차확인하세요.
1. 어떤 검정을 고르나?
| 목적 | 모수 대안 | 비모수 대안 | 비고 |
|---|
| 2개 독립 집단 평균 차이 | Welch t | Mann–Whitney U, Brunner–Munzel, Mood median | 위치(중앙)차이 가정 vs 일반적 분포차 |
| 2개 대응(짝) 집단 평균 차이 | Paired t | Wilcoxon signed-rank, Sign test | 대응쌍 차이의 부호/순위 활용 |
| 3개 이상 독립 집단 평균 차이 | One-way ANOVA | Kruskal–Wallis H | 사후검정: Dunn/Conover 등 |
| 3개 이상 반복측정(대응) | Repeated-measures ANOVA | Friedman | 사후검정: Nemenyi 등 |
| 연관성(연속/서열) | Pearson r | Spearman ρ, Kendall τ | 단조(monotonic) 관계 탐지 |
2. 핵심 이론(직관 + 가설)
2.1 Mann–Whitney U (독립 2집단)
- 아이디어: 두 집단을 합쳐 순위를 매긴 뒤, 한 집단의 순위합이 우연치고 보기 힘들만큼 크거나 작은가?
- 가설
- H₀: 두 집단 분포가 동일 (위치차 없음)
- H₁: 분포가 다르다(주로 위치차 해석)
- 해석 팁: U는 “우월확률(Vargha–Delaney A)”과 연결 → 임의의 X∈A, Y∈B에 대해 P(X>Y)의 확률적 해석 가능.
2.2 Brunner–Munzel (독립 2집단)
- 아이디어: 집단 분포/분산/모양이 달라도 확률적 우위(분위)를 검정.
- 장점: 이분산·비대칭에서도 잘 작동(“위치변화만” 가정이 약함).
2.3 Wilcoxon signed-rank (대응 2집단)
- 아이디어: 짝차이의 절댓값 순위에 부호를 달아 합이 0인지(위치차 0) 검정.
- 대안: 극단값/동점 많으면 Sign test(이항검정)가 더 안전.
2.4 Kruskal–Wallis H (독립 k집단)
- 아이디어: 모든 표본에 순위를 매겨 집단별 순위합이 우연 범위를 벗어나는가?
- 사후검정: Dunn/Conover 등(다중비교 보정 필수).
2.5 Friedman (반복측정 k조건)
- 아이디어: 각 피험자(블록) 안에서 조건들의 순위를 비교해 차이가 일관적으로 큰가?
2.6 순위 상관 (Spearman ρ / Kendall τ)
- 아이디어: 값 자체가 아닌 순위의 일관성을 측정(단조 관계).
3. 효과크기
비모수 검정은 p값만 보고 끝내지 말고, 반드시 “얼마나” 다른지도 함께 제시하세요.
- Vargha–Delaney A (A₁₂): Mann–Whitney의 우월확률
- A=0.5 동일, 0.56(작음), 0.64(중간), 0.71(큼) 관례
- Cliff’s delta (δ): P(X>Y)−P(X<Y) ∈ [−1,1]
- |δ|=0.147(작음), 0.33(중간), 0.474(큼) 관례
- Rank-biserial r(Wilcoxon, Mann–Whitney 해석용)
- Kruskal–Wallis ε²: ε2=n−kH−k+1 (총 n, 집단 k)