통계 3일차

장정근·2025년 4월 7일

오늘은 집중을 많이 못 해서 공부를 많이 못 했다,,
저번에 공부했던 검정통계량과 p-value에 대해서 좀 공부를 했다


1. 가설 검정단계에서 가설 검정은 어떤 주장(가설)이 데이터에 의해 뒷받침되는지를 판단하는 통 계적인 방법이다.

귀무가설(H0) = 기본적으로 '차이가 없다', '효과가 없다'라는 주장
대립가설(H1) = '차이가 있다', '효과가 있다' 라는 주장

ex) H0 = 약을 먹은 그룹과 안 먹은 그룹의 평균 차이는 없다.
H1 = 약을 먹은 그룹이 평균적으로 더 낫다


2. 검정통계량(Test Statistic)

검정통계량은 표본 데이터로부터 계산된 수치로, 귀무가설이 맞는지 틀리는지를 판단하기 위해 사용됨(표본이 얼마나 극단적인가? 를 수치로 표현한 것)

ex) 평균 차이를 비교할 땐 -> t-검정 통계량
분산 차이를 비교할 땐 -> F-검정 통계량
범주형 변수 비교할 땐 -> X^2(카이제곱) 통계량


3. p-value(유의확률)

p-value는 귀무가설이 맞다는 전제 하에, 현재 얻은 데이터처럼 극단적인 결과가 나올 확률(이 결과가 우연히 나타날 수 있는 정도)

해석

  • p-value가 작을수록 -> 관측된 결과가 우연일 가능성이 낮다 -> 귀무가설을 기각할 수 있다.
  • 일반적으로 유의수준 0.05를 기준으로 판단

0.05 < p-value -> 우연일 가능성이 낮다 -> 귀무가설 기각
0.05 > p-value -> 우연일 가능성이 크다 -> 귀무가설 채택


정리 흐름
1. 귀무가설, 대립가설 설정
2. 검정통계량 계산
3. 그 통계량을 기준으로 p-value 계산
4. p-value와 유의수준 비교해서 귀무가설 기각 여부 판단

0개의 댓글