데이터 분석 72일
p-value(유의확률)는 "귀무가설(null hypothesis)이 맞다고 가정했을 때, 지금처럼 극단적인 결과가 나올 확률"을 의미.
ex) 남녀 평균 급여가 같다는 가설(귀무가설) 하에, 표본에서 150유로 차이가 났다면, p-value는 이런 차이가 우연히 나타날 확률을 계산한 값이다.
p-value가 작을수록(보통 0.05 미만) 귀무가설을 기각하고, 대립가설(차이가 있다)을 채택하는 근거가 됨.
| 테스트명 | 사용 조건 | 목적/설명 |
|---|---|---|
| 2-Sample t-test | 두 그룹 평균 비교, 정규성 가정 | 두 집단 평균 차이 검정 |
| Mann-Whitney U Test | 비정규분포, 순위 기반 | 두 집단 중앙값(중앙 순위) 비교 |
| Welch’s t-test | 두 그룹 분산 다를 때 | 분산 다를 때 평균 차이 검정 |
| Chi-Square Test | 범주형 데이터(예: 성공/실패) | 범주별 비율 차이 검정 |
| Bayesian Testing | 확률 기반 해석 원할 때 | 사전확률, 사후확률로 직접적 결과 제공 |
| ANOVA | 세 개 이상 그룹 평균 비교 | 여러 집단 평균 차이 검정 |