비모수 검정

JERRY·2025년 8월 13일

Statistics

목록 보기
13/19

비모수(Nonparametric) 검정

정규성/등분산 가정이 불확실하거나, 이상치가 많고/서열형(순서형) 자료일 때 유용한 분포-자유(distribution-free) 방법들을 정리했습니다. 각 검정은 대응되는 모수검정( t-test / ANOVA )의 대안입니다.


0. 언제 비모수 검정을 쓰나?

  • 데이터가 정규분포를 따르지 않음(강한 왜도/두꺼운 꼬리/다봉형)
  • 집단 간 분산·분포 모양이 다름(이분산/비대칭)
  • 이상치의 영향이 큼
  • 서열형(ordinal) 척도
  • 표본수가 매우 작아 정규성 검정 신뢰가 낮음

표본이 충분히 크면 모수검정(Welch t 등)도 꽤 견고합니다. 다만 효과크기와 신뢰구간을 함께 보고, 민감한 경우 비모수 검정으로 교차확인하세요.


1. 어떤 검정을 고르나?

목적모수 대안비모수 대안비고
2개 독립 집단 평균 차이Welch tMann–Whitney U, Brunner–Munzel, Mood median위치(중앙)차이 가정 vs 일반적 분포차
2개 대응(짝) 집단 평균 차이Paired tWilcoxon signed-rank, Sign test대응쌍 차이의 부호/순위 활용
3개 이상 독립 집단 평균 차이One-way ANOVAKruskal–Wallis H사후검정: Dunn/Conover 등
3개 이상 반복측정(대응)Repeated-measures ANOVAFriedman사후검정: Nemenyi 등
연관성(연속/서열)Pearson rSpearman ρ, Kendall τ단조(monotonic) 관계 탐지

2. 핵심 이론(직관 + 가설)

2.1 Mann–Whitney U (독립 2집단)

  • 아이디어: 두 집단을 합쳐 순위를 매긴 뒤, 한 집단의 순위합이 우연치고 보기 힘들만큼 크거나 작은가?
  • 가설
    • H₀: 두 집단 분포가 동일 (위치차 없음)
    • H₁: 분포가 다르다(주로 위치차 해석)
  • 해석 팁: U는 “우월확률(Vargha–Delaney A)”과 연결 → 임의의 X∈A, Y∈B에 대해 P(X>Y)의 확률적 해석 가능.

2.2 Brunner–Munzel (독립 2집단)

  • 아이디어: 집단 분포/분산/모양이 달라도 확률적 우위(분위)를 검정.
  • 장점: 이분산·비대칭에서도 잘 작동(“위치변화만” 가정이 약함).

2.3 Wilcoxon signed-rank (대응 2집단)

  • 아이디어: 짝차이의 절댓값 순위에 부호를 달아 합이 0인지(위치차 0) 검정.
  • 대안: 극단값/동점 많으면 Sign test(이항검정)가 더 안전.

2.4 Kruskal–Wallis H (독립 k집단)

  • 아이디어: 모든 표본에 순위를 매겨 집단별 순위합이 우연 범위를 벗어나는가?
  • 사후검정: Dunn/Conover 등(다중비교 보정 필수).

2.5 Friedman (반복측정 k조건)

  • 아이디어: 각 피험자(블록) 안에서 조건들의 순위를 비교해 차이가 일관적으로 큰가?

2.6 순위 상관 (Spearman ρ / Kendall τ)

  • 아이디어: 값 자체가 아닌 순위의 일관성을 측정(단조 관계).

3. 효과크기

비모수 검정은 p값만 보고 끝내지 말고, 반드시 “얼마나” 다른지도 함께 제시하세요.

  • Vargha–Delaney A (A₁₂): Mann–Whitney의 우월확률
    • A=0.5 동일, 0.56(작음), 0.64(중간), 0.71(큼) 관례
  • Cliff’s delta (δ): P(X>Y)−P(X<Y) ∈ [−1,1]
    • |δ|=0.147(작음), 0.33(중간), 0.474(큼) 관례
  • Rank-biserial r(Wilcoxon, Mann–Whitney 해석용)
    • Z/√N 또는 공식을 이용
  • Kruskal–Wallis ε²: ε2=Hk+1nk\varepsilon^2 = \frac{H-k+1}{n-k} (총 n, 집단 k)

0개의 댓글