통계 검정

J.H.L·2022년 7월 14일
0
post-thumbnail

1. 통계검정: 가설

1. 가설 검정

  • 설정한 가설이 옳을 때 표본에서의 통계량과 통계량의 분포에서 이론적으로 얻는 특정 값을 비교하여 가설의 기각/채택 여부를 판정하는 방법.

  • 확률적 오차 범위를 넘어서면 가설을 기각한다.

  • 유의수준 (α\alpha): 기각/채택 여부의 판단 기준

2. 가설의 종류

1) 귀무가설(H0)

  • 대립가설과 상반되는 가설로, 일반적인 사실을 귀무가설로 설정
  • 그 신약은 효과가 없다.

2) 대립가설(H1)

  • 입증하고자 하는 가설
  • 그 신약은 효과가 있어!!!

2. 통계검정: 오류

가설설정의 오류의 종류 (error type)

1. 1종 오류 (α\alpha, Type 1 error)

  • 귀무가설을 채택해야 했음에도 이를 기각할 오류
  • 표본으로부터 얻은 검정 결과가 우연에 의해 잘못 판단되었을 가능성
  • α\alpha는 일반적으로 5%로 설정
    ->ex) 신약의 효과가 없었는데도(H0, 귀무가설) 효과가 있었다고 판단(H1, 대립가설)할 오류

2. 2종 오류 (β\beta, Type 2 error)

  • 귀무가설을 기각해야 했음에도 이를 채택할 오류
  • 실제로 약의 효과가 있었는데 효과가 없었다고 잘못 결론 내릴 가능성
  • β\beta는 보통 10%로 설정
    -> ex) 신약 효과 있잖아(H1,대립가설)... 왜 없다고 해(H0, 귀무가설)..

3. 통계검정: 요소

1. 유의수준

  • 제 1종 오류 (α\alpha)를 범할 확률의 최대 허용한계

2. 유의확률 (P-value)

  • 검정 통계량 값에 대해 귀무가설을 기각할 수 있는 최소의 유의 수준.
  • 즉, 귀무가설이 사실일 확률이다.
  • α\alpha > p-value: H0 기각
  • α\alpha < p-value: H0 채택

3. 임계값

  • 임계값: 기각역과 채택역을 나누는 경계값
  • 기각역: 귀무가설을 기각하게 되는 검정통계량의 관측값의 영역 (즉 확률이 α\alpha인 영역)
  • 채택역: 귀무가설을 채택하게 되는 검정통계량의 관측값의 영역 (즉 확률이 1α1-\alpha인 영역)
  • 검정통계량의 관측값이 기각역에 속하면 귀무가설 기각
profile
포항공대 인공지능 대학원에 재학중인 대학원생입니다.

0개의 댓글