가설검정

yst3147·2022년 8월 14일

수리통계학

목록 보기
10/10

Wackerly et al., Mathematical Statistics with Applications을 읽고
책 내용을 정리하였습니다.

10.1 서론

10.2 통계적 검정의 요소

연구가설

지지하기를 원하는 모수에 관한 이론을 연구가설(research hypothesis)라고 한다.

대립가설

연구가설에 대한 지지(연구가설의 대안이 되는 가설)

귀무가설

대립가설에 반대되는 가설

통계적 검정의 요소

  1. 귀무가설, H0H_0
  2. 귀무가설, HaH_a
  3. 검정 통계량
  4. 기각역

검정통계량

검정 통계량(test statistic)은 통계적 결정이 기초로 하는 표본 측정값의 함수

기각역

  • RRRR로 표시
  • 기각역(rejection region)은 대립가설을 지지하여 귀무가설을 기각하는 검정 통계값을 지정

제 1종 오류, 제 2종 오류

제1종 오류

  • 귀무가설이 사실일 때 귀무가설이 기각되면 발생
  • 오류 확률을 α\alpha로 나타냄
    -> α\alpha의 값을 검정의 수준(level of the test)이라 함

제2종 오류

  • 대립가설이 사실일 때 귀무가설이 채택되면 발생
  • 오류 확률을 β\beta로 나타냄

10.3 대표본 검정

위쪽꼬리 기각역

Ha:θ>θ0H_a: \theta > \theta_0를 위쪽 꼬리 대립가설이라 할 때
RR=z>zaRR = {z > z_a}위쪽꼬리 기각역(upper-tail rejection region)이라 한다.

아래쪽 꼬리 기각역

Ha:θ<θ0H_a: \theta < \theta_0를 아래쪽 꼬리 대립가설이라 할 때
RR=z<zaRR = {z < -z_a}아래쪽꼬리 기각역(upper-tail rejection region)이라 한다.

양쪽꼬리검정

기각역이 Z의 확률분포의 두 꼬리에 대칭으로 위치하는 경우 양쪽꼬리검정(two-tailed tests)라 한다.

한쪽꼬리검정

기각역이 Z의 확률분포의 한쪽 꼬리에 위치하는 경우 한쪽꼬리검정(one-tailed tests)라 한다.

대표본 α\alpha-수준 가설검정

  • H0:θ=θ0H_0 : \theta = \theta_0
  • HαH_\alpha
    • θ>θ0\theta > \theta_0 (위쪽 꼬리 대립가설)
    • θ<θ0\theta < \theta_0 (아래쪽 꼬리 대립가설)
    • θθ0\theta \neq \theta_0 (아래쪽 꼬리 대립가설)
  • 검정 통계량 : Z=θ^θ0αθ^Z = \frac{\hat{\theta} - \theta_0}{\alpha_{\hat{\theta}}}
  • 기각역
    • Z>zαZ > z_\alpha (위쪽 꼬리 RR)
    • Z<zαZ < -z_\alpha (아래쪽 꼬리 RR)
    • Z>zα/2|Z| > z_{\alpha/2} (아래쪽 꼬리 RR)

10.4 Z검정의 제2종 오류확률 계산과 표본크기 구하기

위쪽 꼬리 α\alpha수준 검정에 대한 표본크기

n=(zα+zβ)2σ2(μaμ0)2n = \frac{(z_{\alpha} + z_{\beta})^2\sigma^2}{(\mu_a -\mu_0)^2}

10.5 가설검정 절차와 신뢰구간의 관계

채택역

임의의 검정과 관련된 기각역의 여집합을 때때로 검정의 채택역(acceptance region)이라 한다.

채택가능

  • 100(1α)100(1-\alpha)% 양측 신뢰구간은 H0:θ=θ0H_0 : \theta = \theta_0를 수준 α\alpha에서 채택가능(acceptable)θ0\theta_0의 모든 값의 집합으로 해석 가능
  • 귀무가설을 반드시 채택(accept)하지는 않음

10.6 통계적 검정결과 보고방법: p값

유의수준

제1종 오류 확률 α\alpha를 일반적으로 유의수준(significance level) 혹은 검정의 수준(level of the test)이라고 한다.

p값

만일 WW가 검정 통계량이라면 pp값은 관측된 자료가 귀무가설이 기각되어야 한다는 것을 나타내는 유의수준 α\alpha의 최소수준이다.

10.7 가설검정의 이론에 대한 몇 가지 이야기

10.8 μ\muμ1μ2\mu_1 - \mu_2에 대한 소표본 가설검정

t검정

  • t 분포에 기초한 μ\mu에 대한 검정

μ\mu에 대한 소표본 검정

  • 가정 : Y1,Y2,...,YnY_1, Y_2, ..., Y_nE(Yi)=μE(Y_i) = \mu를 갖는 정규분포로부터의 확률 표본이다
  • H0:μ=μ0H_0 : \mu = \mu_0
  • HaH_a :
    • μ>μ0\mu > \mu_0
    • μ<μ0\mu < \mu_0
    • μμ0\mu \neq \mu_0
  • 검정 통계량 : T=Yˉμ0S/nT = \frac{\bar{Y}-\mu_0}{S/\sqrt{n}}
  • 기각역
    - t>tαt > t_{\alpha}
    - t<tαt < -t_{\alpha}
    - t>tα/2|t| > t_{\alpha/2}
    (자유도 ν=n1\nu = n - 1tαt_{\alpha})

두 모평균 비교를 위한 소표본 검정

  • 가정 : α12=α22\alpha_1^2 = \alpha_2^2인 정규분포로부터의 독립표본
  • H0:μ1μ2=D0H_0 : \mu_1 - \mu_2 = D_0
  • HaH_a :
    • μ1μ2>D0\mu_1 - \mu_2 > D_0
    • μ1μ2<D0\mu_1 - \mu_2 < D_0
    • μ1μ2D0\mu_1 - \mu_2 \neq D_0
  • 검정 통계량 : T=(Y1ˉY2ˉ)D0Sp1n1+1n2,Sp=(n11)S12+(n21)S22n1+n22T = \frac{(\bar{Y_1}-\bar{Y_2})-D_0}{S_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}, S_p = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}
  • 기각역
    • t>tαt > t_{\alpha}
    • t<tαt < -t_{\alpha}
    • t>tα/2|t| > t_{\alpha/2}

(여기서 P(T>tα)=αP(T>t_{\alpha}) = \alpha, 자유도 ν=n1+n22\nu = n_1 + n_2 - 2)

로버스트 통계적 검정

기본 가정에서 벗어남에 민감하지 않은 통계적 검정

10.9 분산에 대한 가설검정

모분산에 관한 가설검정

  • 가정 : Y1,Y2,...,YnY_1, Y_2, ..., Y_nE(Yi)=μE(Y_i) = \mu, V(Yi)=σ2V(Y_i) = \sigma^2을 갖는 정규분포로부터의 확률 표본
  • H0:σ2σ02H_0 : \sigma^2 - \sigma_0^2
  • HαH_{\alpha}:
    • σ2>σ02\sigma^2 > \sigma_0^2
    • σ2<σ02\sigma^2 < \sigma_0^2
    • σ2σ02\sigma^2 \neq \sigma_0^2
  • 검정 통계량 : χ2=(n1)S2σ02\chi^2 = \frac{(n-1)S^2}{\sigma_0^2}
  • 기각역
    • χ2>χα2\chi^2 > \chi_{\alpha}^2
    • χ2<χα2\chi^2 < \chi_{\alpha}^2
    • χ2>χα/22\chi^2 > \chi_{\alpha/2}^2 혹은 χ2<χ1α/22\chi^2 < \chi_{1-\alpha/2}^2

(여기서 χα2\chi_{\alpha}^2은 자유도 ν=n1\nu = n -1에 대하여 P(χ2>χα2)=αP(\chi^2 >\chi_{\alpha}^2) = \alpha가 되도록 선택)

가설 σ12=σ2\sigma_1^2 = \sigma^2의 검정

  • 가정 : 정규 모집단으로부터의 독립 표본
  • H0:σ12=σ22H_0 : \sigma_1^2 = \sigma_2^2
  • HαH_{\alpha}
    • σ12>σ22\sigma_1^2 > \sigma_2^2
  • 검정 통계량 : F=S12/S22F = S_1^2/S_2^2
  • 기각역 : F>FαF > F_\alpha
    여기서 FαF_\alphaFFν1=(n11)\nu_1 = (n_1 - 1)ν2=(n21)\nu_2 = (n_2 - 1)FF분포를 따를 때 P(F>Fα)=αP(F > F_\alpha) = \alpha가 되는 값이다.

10.10 검정력과 네이만-피어슨 보조정리

10.11 가능도비 검정

10.12 요약

0개의 댓글