오늘은 집중을 많이 못 해서 공부를 많이 못 했다,,
저번에 공부했던 검정통계량과 p-value에 대해서 좀 공부를 했다
귀무가설(H0) = 기본적으로 '차이가 없다', '효과가 없다'라는 주장
대립가설(H1) = '차이가 있다', '효과가 있다' 라는 주장
ex) H0 = 약을 먹은 그룹과 안 먹은 그룹의 평균 차이는 없다.
H1 = 약을 먹은 그룹이 평균적으로 더 낫다
검정통계량은 표본 데이터로부터 계산된 수치로, 귀무가설이 맞는지 틀리는지를 판단하기 위해 사용됨(표본이 얼마나 극단적인가? 를 수치로 표현한 것)
ex) 평균 차이를 비교할 땐 -> t-검정 통계량
분산 차이를 비교할 땐 -> F-검정 통계량
범주형 변수 비교할 땐 -> X^2(카이제곱) 통계량
p-value는 귀무가설이 맞다는 전제 하에, 현재 얻은 데이터처럼 극단적인 결과가 나올 확률(이 결과가 우연히 나타날 수 있는 정도)
해석
0.05 < p-value -> 우연일 가능성이 낮다 -> 귀무가설 기각
0.05 > p-value -> 우연일 가능성이 크다 -> 귀무가설 채택
정리 흐름
1. 귀무가설, 대립가설 설정
2. 검정통계량 계산
3. 그 통계량을 기준으로 p-value 계산
4. p-value와 유의수준 비교해서 귀무가설 기각 여부 판단