기초통계학 - (4-2) 가설검정-Z검정,t검정

Kyung Jae, Cheong·2022년 8월 15일

기초통계학(요약)

목록 보기
8/9

Z검정,t검정

Keyword - Z검정, 단일표본Z검정, 신뢰구간, 두표본Z검정, 비율검정, t검정


Z검정(Ztest)

  • Z분포에 의하여 가설을 검정하는 통계적 방법
  • 다음 네가지 조건을 만족할때 사용
    (만족못하면 t검정이나 비모수 통계를 실시)
    • 종속변수가 양적변수
    • 모집단의 분산(σ\sigma)을 알아야함
    • 모집단의 분포가 정규분포여야함
    • 두 모집단을 비교할 경우, 두모집단의 분산이 같아야함
  • Z검정의 분류
    • 단일표본 Z검정
    • 두 독립표본 Z검정
    • 두 종속표본 Z검정
    • 비율검정
    • 상관계수 검정
  • 검정방법 분류
    • Z통계값에 의한 점추정
    • 신뢰구간에 의한 구간추정
  • 기각영역 설정에 따른 분류
    • 양방적(two-tailed)검정
    • 일방적(0ne-tailed)검정

단일표본 Z검정(One sample Z test)

  • Z 통계값에 의한 검정
    • H0H_0, H1H_1을 세운다.
    • α\alphann을 설정한다.
    • xˉ\bar x를 계산한다.
    • σxˉ\sigma_{\bar x}를 계산한다.
      • σxˉ=σxn\sigma_{\bar x}=\frac{\sigma_x}{\sqrt n}
    • Z통계값을 계산한다.(μ\mu는 귀무가설 값)
      • Z=xˉμσxˉZ = \frac{\bar x - \mu}{\sigma_{\bar x}}
    • 유의수준을 고려하여 Z분포표에 의한 기각값을 찾는다.
    • 결론을 내린다.
  • 신뢰구간에 의한 검정
    • 신뢰구간은 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법
    • 유의수준 0.05에서 모수치의 범위(양방적검증)
      • xˉ1.96σxˉμxˉ+1.96σxˉ\bar x -1.96\sigma_{\bar x}\le \mu \le \bar x +1.96\sigma_{\bar x}
    • 따라서 유의수준 0.05에서 영가설을 기각하지 않는 구역은 다음과 같음
      • μ1.96σxˉxˉμ+1.96σxˉ\mu-1.96\sigma_{\bar x} \le \bar x \le \mu+1.96\sigma_{\bar x}
    • 즉, 표본의 평균이 μ±1.96σxˉ\mu \pm 1.96\sigma_{\bar x} 사이가 아닌 밖에 있다면 영가설을 기각한다.
      • 일방적검증(유의수준0.05)
        xˉμ+1.645σxˉ\bar x \le\mu + 1.645\sigma_{\bar x}
        혹은
        xˉμ1.645σxˉ\bar x \ge\mu - 1.645\sigma_{\bar x}
        일때 영가설을 기각하지 못함

두 표본 Z검정(Two samples Ztest)

  • 두 독립표본 Z검정(two independent samples Z test)
    • H0H_0, H1H_1을 세운다.
    • α\alphan1n_1,n2n_2을 설정한다.
    • 두표본으로부터 xˉ1\bar x_1,xˉ2\bar x_2를 계산한다.
    • σxˉ1xˉ2\sigma_{\bar x_1-\bar x_2}를 계산한다.
      • σxˉ1xˉ2=σ12n1+σ22n2\sigma_{\bar x_1-\bar x_2}=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}
    • Z값을 계산한다.
      • Z=xˉ1xˉ2σxˉ1xˉ2Z = \frac{\bar x_1 - \bar x_2}{\sigma_{\bar x_1-\bar x_2}}
    • 유의수준에 의해 Z분포상의 기각값을 찾는다.
    • 결론을 내린다.
  • 두 종속표본 Z검정(two dependent samples Z test)
    • 독립표본과 틀은 비슷하지만, 상관계수 r값을 구해야함
    • 표준오차σxˉ1xˉ2\sigma_{\bar x_1-\bar x_2}
      • σxˉ1xˉ2=σ12n1+σ22n22rσ1σ2n1n2\sigma_{\bar x_1-\bar x_2}=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}-2r\frac{\sigma_1\sigma_2}{\sqrt{n_1n_2}}}
    • Z값
      • Z=xˉ1xˉ2σxˉ1xˉ2Z = \frac{\bar x_1-\bar x_2}{\sigma_{\bar x_1-\bar x_2}}

비율검정(Proportion test)

  • 단일표본 비율검정
    • H0H_0, H1H_1을 세운다.
    • α\alphann을 설정한다.
    • 표본비율 p^\hat p를 계산한다.
    • σp^\sigma_{\hat p}를 계산한다(p0p_0는 영가설)
      • σp^=p0(1p0)n\sigma_{\hat p}=\sqrt{\frac{p_0(1-p_0)}{n}}
    • Z값을 계산한다.
      • Z=p^p0σp^Z = \frac{\hat p - p_0}{\sigma_{\hat p}}
    • 유의수준을 고려하여 Z분포표에 의한 기각값을 찾는다.
    • 결론을 내린다.
  • 두 독립표본 비율검정
    • H0H_0, H1H_1을 세운다.
    • α\alphan1n_1,n2n_2을 설정한다.
    • 두표본으로부터 p^1\hat p_1,p^2\hat p_2를 계산한다.
    • pˉ\bar p를 계산한다.
      • pˉ=n1p^1+n2p^2n1+n2\bar p=\frac{n_1\hat p_1+n_2\hat p_2}{n_1+n_2}
    • σp^1p^2\sigma_{\hat p_1-\hat p_2}를 계산한다
      • σp^1p^2=pˉ(1pˉ)(1n1+1n2)\sigma_{\hat p_1-\hat p_2}=\sqrt{\bar p(1-\bar p)(\frac{1}{n_1}+\frac{1}{n_2})}
    • Z값을 구한다.
      • Z=p^1p^2σp^1p^2Z = \frac{\hat p_1-\hat p_2}{\sigma_{\hat p_1-\hat p_2}}
    • 유의수준을 고려하여 Z분포표에 의한 기각값을 찾는다.
    • 결론을 내린다.

t검정(t-test)

  • 다음 네가지 조건을 만족할때 사용
    (만족못하면 비모수 통계를 실시)
    • 종속변수가 양적변수
    • 모집단의 분산,표준편차를 알지 못할 때 사용
    • 모집단의 분포가 정규분포여야함
    • 등분산 가정이 충족되어야함
  • 샘플로부터 분산을 구할땐 반드시 n-1로 나눠서 불편차 추정치를 사용
    • sx=Σ(yiyˉ)2n1s_x=\frac{\Sigma (y_i-\bar y)^2}{n-1}
    • σxˉ=sxn\sigma_{\bar x}=\frac{s_x}{\sqrt n}
  • t분포에 의하여 기각값을 찾을때, α\alphadfdf값에 따른 기각값을 찾아야함.
  • 그 외엔 Z검정과 절차는 거의 동일함.

단일표본 t검정(One sample t-test)

  • t 통계값에 의한 검정
    • H0H_0, H1H_1을 세운다.
    • α\alphann을 설정한다.
    • xˉ\bar xsxs_x를 계산한다.
    • σxˉ\sigma_{\bar x}를 계산한다.
      • σxˉ=sxn\sigma_{\bar x}=\frac{s_x}{\sqrt n}
    • t값을 계산한다.
      • t=xˉμxσxˉt=\frac{\bar x-\mu_x}{\sigma_{\bar x}}
    • t분포표에서 α\alphadfdf값에 따른 기각값을 찾는다.
    • 결론을 내린다.
  • 신뢰구간에 의한 검정
    • μt0.95,n1σxˉxˉμ+t0.95,n1σxˉ\mu-t_{0.95,n-1}\cdot \sigma_{\bar x} \le \bar x \le \mu+t_{0.95,n-1}\cdot \sigma_{\bar x}

두표본 t검정(Two samples t-test)

  • 두 종속표본 t검정(two dependent samples t-test)
    • H0H_0, H1H_1을 세운다.
    • α\alphann을 설정한다.
    • 두변수의 차이 dd를 계산한다.
    • dˉ\bar dsds_d를 계산한다.
    • σdˉ\sigma_{\bar d}를 계산한다.
      • σdˉ=sdn\sigma_{\bar d}=\frac{s_d}{\sqrt n}
    • t값을 계산한다.
      • t=dˉσdˉt=\frac{\bar d}{\sigma_{\bar d}}
    • t분포표에서 α\alphadfdf값에 따른 기각값을 찾는다.
    • 결론을 내린다.
  • 두 독립표본 t검정(two independent samples t-test)
    • H0H_0, H1H_1을 세운다.
    • α\alphan1n_1,n2n_2을 설정한다.
    • xˉ1\bar x_1,xˉ2\bar x_2,s12s^2_1,s22s^2_2를 계산한다.
    • 통합분산 sp2s^2_p를 계산한다.
      • sp2=(n11)s12+(n21)s22(n11)+(n21)s^2_p=\frac{(n_1-1)s^2_1+(n_2-1)s^2_2}{(n_1-1)+(n_2-1)}
    • σxˉ1xˉ2\sigma_{\bar x_1-\bar x_2}를 계산한다.
      • σxˉ1xˉ2=sp2(1n1+1n2)\sigma_{\bar x_1-\bar x_2}=\sqrt{s^2_p(\frac{1}{n_1}+\frac{1}{n_2})}
    • t값을 계산한다.
      • t=xˉ1xˉ2σxˉ1xˉ2t=\frac{\bar x_1-\bar x_2}{\sigma_{\bar x_1-\bar x_2}}
    • t분포표에서 α\alphadfdf값에 따른 기각값을 찾는다.
      • tα,dft_{\alpha,df}에서 df=(n11)+(n21)df = (n_1-1)+(n_2-1)
    • 결론을 내린다.
profile
일 때문에 포스팅은 잠시 쉬어요 ㅠ 바쁘다 바빠 모두들 화이팅! // Machine Learning (AI) Engineer & BackEnd Engineer (Entry)

0개의 댓글