DS School Week 10-3 통계 : 가설 검정

Henny Song·2023년 7월 15일
0

DS Studylog

목록 보기
32/38
post-thumbnail

오늘 학습 계획

  • 통계 : 가설 검정 강의 수강

학습 내용

1. 가설 검정

  • 가설 : 주어진 사실 또는 조사하려고 하는 사실에 대한 주장 또는 추측.
    통계학에서는 모수를 추정할때 모수가 어떠하다는 증명하고 싶은 추측이나 주장.

  • 가설의 종류

    • 귀무 가설 H0H_0
      • 기존의 사실
      • 대립가설과 반대되는 가설
    • 대립 가설 H1H_1
      • 데이터로부터 나온 주장하고 싶은 가설 또는 연구의 목적
  • 가설 검정의 개념

    • 제 1종 오류 (type 1 error)
      • 귀무가설이 참이지만, 귀무가설을 기각하는 오류
      • 제 1종 오류를 범할 확률의 최대 허용 한계를 유의수준 이라고 함.
        (유의수준 : 신뢰구간의 반대말)
    • 제 2종 오류 (type 2 error)
      • 귀무가설이 기각해야 하지만, 귀무가설을 채택하는 오류
    • 검정 통계량
      • 귀무가설이 참이라는 가정하에 얻은 통계량
      • 검정 결과 대립가설을 선택하게 되면 귀무가설을 기각함.
        검정 결과 귀무가설을 선택하게 되면 귀무가설을 기각하지 못한다고 표현함.
    • P-value
      • 귀무가설이 참일 확률
        (귀무가설이 참이라는 가정하에 통계량이 귀무가설을 얼마나 지지하는지를 나타내는 확률)
    • 기각역
      • 귀무가설을 기각시키는 검정통계량의 관측값의 영역
  • 가설 검정의 절차

    1. 가설 수립
    2. 유의 수준 결정
    3. 기각역 설정
    4. 검정통계량 계산
    5. 의사 결정
  • 검정의 종류

    • 양측검정
      • 대립가설의 내용이 같지 않다 또는 차이가 있다 등의 양쪽 방향의 주장
    • 단측검정
      • 대립가설의 내용이 크다 또는 작다 처럼 한쪽 방향의 주장

2. 단일 표본에 대한 가설 검정

  • 모평균 가설검정 (모분산을 아는 경우)
    • 검정통계량 : Z=Xˉμσ/nN(0,1)Z = {\bar X - \mu \over \sigma / \sqrt n} \sim N(0,1)
    • 기각역 : z0=Xˉμ0σ/nz_0 = {\bar X - \mu_0 \over \sigma /n}
    • 검정
      • 가설 : H0:μ=μ0H_0 : \mu = \mu_0 vs H1:μ!=μ0H_1 :\mu != \mu_0
        z0zα/2\Rightarrow |z_0| \ge z_{\alpha /2} 이면 H0H_0기각
      • 가설 : H0:μ=μ0H_0 : \mu = \mu_0 vs H1:μ>μ0H_1 :\mu > \mu_0
        z0zα\Rightarrow z_0 \ge z_\alpha 이면 H0H_0기각
      • 가설 : H0:μ=μ0H_0 : \mu = \mu_0 vs H1:μ<μ0H_1 :\mu < \mu_0
        z0zα\Rightarrow z_0 \le -z_\alpha 이면 H0H_0기각
  • 모평균 가설검정 (모분산을 모르는 경우 : 소표본)
    • 검정통계량 : T=Xˉμσ/nt(n1)T = {\bar X - \mu \over \sigma / \sqrt n} \sim t(n-1)
    • 기각역 : t0=Xˉμ0σ/nt_0 = {\bar X - \mu_0 \over \sigma /n}
    • 검정
      • 가설 : H0:μ=μ0H_0 : \mu = \mu_0 vs H1:μ!=μ0H_1 :\mu != \mu_0
        t0tα/2(n1)\Rightarrow |t_0| \ge t_{\alpha /2}(n-1) 이면 H0H_0기각
      • 가설 : H0:μ=μ0H_0 : \mu = \mu_0 vs H1:μ>μ0H_1 :\mu > \mu_0
        t0tα(n1)\Rightarrow t_0 \ge t_\alpha(n-1) 이면 H0H_0기각
      • 가설 : H0:μ=μ0H_0 : \mu = \mu_0 vs H1:μ<μ0H_1 :\mu < \mu_0
        t0tα(n1)\Rightarrow t_0 \le -t_\alpha(n-1) 이면 H0H_0기각
  • 모비율 가설검정
    • 검정통계량 : z=p^pp(1p)/nN(0,1)z = {\hat p - p\over \sqrt{p(1-p)/n}} \sim N(0, 1)
    • 기각역 : z0=p^p0p0(1p0)/nz_0 = {\hat p - p_0\over \sqrt{p_0(1-p_0)/n}}
    • 검정
      • 가설 : H0:p^=p0H_0 : \hat p = p_0 vs H1:p^p0H_1 :\hat p \ne p_0
        z0zα/2\Rightarrow |z_0| \ge z_{\alpha/2} 이면 H0H_0기각
      • 가설 : H0:p^=p0H_0 : \hat p = p_0 vs H1:p^>p0H_1 :\hat p > p_0
        z0zα\Rightarrow z_0 \ge z_\alpha 이면 H0H_0기각
      • 가설 : H0:p^=p0H_0 : \hat p = p_0 vs H1:p^<p0H_1 :\hat p < p_0
        z0zα\Rightarrow z_0 \le -z_\alpha 이면 H0H_0기각

3. 두 개 표본에 대한 가설 검정

  • 모분산을 아는 경우
    • 검정통계량 : z=(Xˉ1Xˉ2)(μ1μ2)σ12/n1+σ22/n2N(0,1)z = {(\bar X_1 - \bar X_2) - (\mu_1 - \mu_2)\over \sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}} \sim N(0,1)
    • 기각역 :z0=(Xˉ1Xˉ2)σ12/n1+σ22/n2z_0 = {(\bar X_1 - \bar X_2)\over \sqrt{\sigma_1^2 / n_1 + \sigma_2^2 /n_2}}
    • 검정
      • 가설 : H0:μ1=μ2H_0 : \mu_1 = \mu_2 vs H1:μ1μ2H_1 : \mu_1 \ne \mu_2
        z0zα/2\Rightarrow |z_0| \ge z_{\alpha/2} 이면 H0H_0기각
      • 가설 : H0:μ1=μ2H_0 : \mu_1 = \mu_2 vs H1:μ1>μ2H_1 : \mu_1 > \mu_2
        z0zα\Rightarrow z_0 \ge z_\alpha 이면 H0H_0기각
      • 가설 : H0:μ1=μ2H_0 : \mu_1 = \mu_2 vs H1:μ1<μ2H_1 : \mu_1 < \mu_2
        z0zα\Rightarrow z_0 \le -z_\alpha 이면 H0H_0기각
  • 모분산을 모르는 경우
    • 검정통계량 : T=(Xˉ1Xˉ2)(μ1μ2)Spσ12/n1+σ22/n2t(n1+n22)T = {(\bar X_1 - \bar X_2) - (\mu_1 - \mu_2)\over S_p\sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}} \sim t(n_1 + n_2 -2)
    • 기각역 :T0=(Xˉ1Xˉ2)Sp2σ12/n1+σ22/n2T_0 = {(\bar X_1 - \bar X_2)\over S_p^2 \sqrt{\sigma_1^2 / n_1 + \sigma_2^2 /n_2}}
      Sp2=(n11)s12+(n21)s22n1+n22S_p^2 = {(n_1-1)s_1^2 + (n_2-1)s_2^2\over n_1+n_2 -2}
    • 검정
      • 가설 : H0:μ1=μ2H_0 : \mu_1 = \mu_2 vs H1:μ1μ2H_1 : \mu_1 \ne \mu_2
        t0tα/2\Rightarrow |t_0| \ge t_{\alpha/2} 이면 H0H_0기각
      • 가설 : H0:μ1=μ2H_0 : \mu_1 = \mu_2 vs H1:μ1>μ2H_1 : \mu_1 > \mu_2
        t0tα\Rightarrow t_0 \ge t_\alpha 이면 H0H_0기각
      • 가설 : H0:μ1=μ2H_0 : \mu_1 = \mu_2 vs H1:μ1<μ2H_1 : \mu_1 < \mu_2
        t0tα\Rightarrow t_0 \le -t_\alpha 이면 H0H_0기각
  • 대응 비교 \Rightarrow 단일 표본화
    • 쌍으로 조사된 자료(X1,Y1),(X2,Y2),,(Xi,Yi)(X_1, Y_1), (X_2, Y_2), \cdots ,(X_i, Y_i)에서 Xi,YiX_i,Y_i의 평균을 μx,μy\mu_x, \mu_y라고할 때,
      Di=XiYiD_i = X_i - Y_i
    • 검정통계량: T=DμDSDnt(n1)T={D - \mu_D\over S_D\sqrt n} \sim t(n-1)
    • 기각역 : T0=DμDSDnT_0={D-\mu_D \over S_D\sqrt n}
    • 검정
      • 가설 : H0:μD=0H_0 : \mu_D = 0 vs H1:μD0H_1 : \mu_D \ne 0
        t0tα/2\Rightarrow |t_0| \ge t_{\alpha/2} 이면 H0H_0기각
      • 가설 : H0:μD=0H_0 : \mu_D = 0 vs H1:μD>0H_1 : \mu_D > 0
        t0tα\Rightarrow t_0 \ge t_\alpha 이면 H0H_0기각
      • 가설 : H0:μD=0H_0 : \mu_D = 0 vs H1:μD<0H_1 : \mu_D <0
        t0tα\Rightarrow t_0 \le -t_\alpha 이면 H0H_0기각

다음 학습 계획

  • 통계 : 자료분석 강의 수강

0개의 댓글

관련 채용 정보