[통계] 가설검정

hhs012·2024년 1월 6일

Statistics

목록 보기
4/4

1.가설검정(유의성 검정)
-가설을 전통적인 통계분석 방법으로 검정하는 것
-관찰된 효과가 우연에 의한 것인지 여부를 알아내는 것이 목적

<가설검정 절차>
1. 유의수준(a)결정, 귀무가설과 대립가설 설정
2. 검정 통계랑 설정
3. 기각역 설정
4. 검정통계량 계산
5. 통계적인 의사결정

귀무가설
-그룹A와 그룹B의 평균에는 차이가 없다
-그룹들이 보이는 결과는 서로 동일하여, 그룹 간 차이는 우연이 기본 설정

대립가설
-그룹A와 그룹B와 다르다(더 크거나 작을 수 있다)
-귀무가설과 대립하는 가설

유의수준(α)
-귀무가설의 기각 여부를 결정하는데 기준이 되는 확률
-즉, 제 1종 오류를 범할 최대 확률이 유의수준(α)
-α: 0.05(5%)가 기준 (0.05보다 작으면 결과가 유의미한 차이가 있다.)

*p-value: 유의확률=1종 오류를 범할 확률

기각역
-귀무가설을 기각하게 되는 관측값의 영역

제 1종 오류: 귀무가설이 참일 때, 귀무가설 기각
제 2종 오류: 대립가설이 참일 때, 귀무가설 기각 못함

-일반적으로 제 1종 오류가 위험함.

p값
-귀무가설이 맞다는 전제 하에 어떤 사건이 우연히 일어날 확률

2. t검정(t-test)

-t검정: 2표본 비교(A/B검정)에 주로 사용

<t-test의 조건>
1. 표본이 독립적인가?
2. 수집된 데이터가 정규분포를 따르는가?
3. 집단이 두 개인가? (비교군과 대조군이 각 1개씩 존재하는가?)

*집단이 3개 이상인 경우에는 ANOVA를 사용

1) 차이검정 (범주+연속형)
-변수 2개일 때: t-검정
-변수 3개일 때: 분산분석(ANOVA)

분산분석의 가정
-각 모집단은 정규분포를 이루어야함
-집단 간 분산은 비슷하나 동일해야함
-독립적인 표본 추출
-적절한 표본의 크기

2) 관계검정 (연속형+연속형/단, 교차분석은 범주형+범주형)
-범주형+범주형: 교차분석
-1:1 : 상관분석
-1:N : 회귀분석

0개의 댓글