[038] 기초통계 - 가설검정 / 심화①

이연희·2023년 10월 10일
0

Chapter
📗 1. 가설 검정
📝 (1) 가설검정과 유의 수준
📝 (2) 단일 표본에 대한 가설
📝 (3) 두 개의 표본에 대한 가설 검정

📗 1. 가설 검정

📝 (1) 가설검정과 유의 수준

  • 가설
    모수를 추정할 때 모수가 어떠하다는 증명하고 싶은 추축이나 주장

  • 귀무가설(Null hypothesis: H0H_{0})
    기존의 사실(아무것도 없다, 의미가 없다)
    대립가설과 반대되는 가설로 연구하고자하는 가설의 반대의 가설로 연구목적이 아님
    EX) H0H_{0}: 코로나 백신은 효과가 없다, H0:μ=0H_{0}:\mu=0

  • 대립가설(Alternative hypothesi: H1H_{1})
    데이터로부터 나온 주장하고 싶은 가설 또는 연구의 목적으로 귀무가설의 반대
    EX) H1H_{1}: 코로나 백신은 효과가 있다, H1:μ0H_{1}:\mu≠0 or μ0\mu \geq 0

  • 제1종 오류(type Ⅰ error)
    귀무가설이 참이지만, 귀무가설을 기각하는 오류
    귀무가설을 기각할 확률이 α\alpha라고 하면 채택하게 될 확률은 1α1-\alpha
    제1종 오류를 범할 확률의 최대허용 한계를 유의수준이라고 하며, α\alpha라고 표시

  • 제2종 오류(type Ⅱ error)
    귀무가설이 기각해야 하지만, 귀무가설을 채택하는 오류

  • 검정통계량
    귀무가설이 참이라는 가정하에 얻은 통계량
    검정결과 대립가설을 선택하게 되면 귀무가설을 기각함
    검정결과 귀무가설을 선택하게 되면 귀무가설을 기각하지 못한다고 표현함

  • P-value
    귀무가설이 참일 확률
    0~1 사이의 표준화된 지표(확률값)
    귀무가설이 참이라는 가정하에 통계량이 귀무가설을 얼마나 지지하는지를 나타낼 확률

  • 기각역(reject region)
    귀무가설을 기각시키는 검정통계량의 관측값의 영역

  • 가설검정의 절차
    가설 수립: 귀무가설과 대립가설을 정한다
    유의수준(α\alpha) 결정
    기각역 설정
    검정통계량 계산
    의사결정

  • 가설검정의 종류
    양측검정(two-side test)
    대립가설의 내용이 같지 않다 또는 차이가 있다 등의 양쪽 방향의 주장
    단측검정(one-side test)
    한쪽만 검증하는 방식으로 대맂가설의 내용이 크다 또는 작다처럼 한쪽 방향의 주장

.
.

📝 (2) 단일 표본에 대한 가설 검정

1) 모평균의 가설검정 - 모분산을 아는 경우

  • 가설
    a) H0:μ=μ0H_{0}:\mu=\mu_{0} vs. H1:μμ0H_{1}:\mu \neq \mu_{0}
    b) H0:μ=μ0H_{0}:\mu=\mu_{0} vs. H1:μμ0H_{1}:\mu \geq \mu_{0}
    c) H0:μ=μ0H_{0}:\mu=\mu_{0} vs. H1:μμ0H_{1}:\mu \leq \mu_{0}
    ⇒ 유의수준: α\alpha=0.05, 검정통계량:z=xˉμσ/nz=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}~N(0,1)N(0,1)
  • 기각역: z0=xˉμ0σ/nz_{0}=\frac{\bar{x}-\mu_{0}}{\sigma/\sqrt{n}}
    a) z0zα/2|z_{0}|\geq z_{\alpha/2} 이면 H0H_{0}기각
    b) z0zαz_{0}\geq z_{\alpha} 이면 H0H_{0}기각
    c) z0zαz_{0}\leq -z_{\alpha} 이면 H0H_{0}기각

2) 모평균의 가설검정 - 모분산을 모르는 경우(소표본)

  • 가설
    a) H0:μ=μ0H_{0}:\mu=\mu_{0} vs. H1:μμ0H_{1}:\mu \neq \mu_{0}
    b) H0:μ=μ0H_{0}:\mu=\mu_{0} vs. H1:μμ0H_{1}:\mu \geq \mu_{0}
    c) H0:μ=μ0H_{0}:\mu=\mu_{0} vs. H1:μμ0H_{1}:\mu \leq \mu_{0}
    ⇒ 유의수준: α\alpha=0.05, 검정통계량:T=xˉμσ/nT=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}~t(0,1)t(0,1)
  • 기각역: t0=xˉμ0σ/nt_{0}=\frac{\bar{x}-\mu_{0}}{\sigma/\sqrt{n}}
    a) t0tα/2|t_{0}|\geq t_{\alpha/2} 이면 H0H_{0}기각
    b) t0tαt_{0}\geq t_{\alpha} 이면 H0H_{0}기각
    c) t0tαt_{0}\leq -t_{\alpha} 이면 H0H_{0}기각

.

3) 모비율의 가설검정

  • 가설
    a) p^=p0\hat{p}=p_{0} vs. H1:p^p0H_{1}:\hat{p} \neq p_{0}
    b) p^=p0\hat{p}=p_{0} vs. H1:p^p0H_{1}:\hat{p} \geq p_{0}
    c) p^=p0\hat{p}=p_{0} vs. H1:p^p0H_{1}:\hat{p} \leq p_{0}
    ⇒ 유의수준: α\alpha=0.05, 검정통계량:z=p^p0p(1p)/nz=\frac{\hat{p}-p_{0}}{\sqrt{p(1-p)/n}} ~ N(0,1)N(0,1)
    검정통계량 관측값: z0=p^p0p0(1p0)/nz_{0}=\frac{\hat{p}-p_{0}}{\sqrt{p_{0}(1-p_{0})/n}}

.
.

📝 (3) 두 개의 표본에 대한 가설 검정

1) 대표본 - 모분산을 아는 경우

  • 가설
    a) H0:μ1=μ2H_{0}:\mu_{1}=\mu_{2} vs. H1:μ1μ2H_{1}:\mu_{1} \neq \mu_{2}
    b) H0:μ1=μ2H_{0}:\mu_{1}=\mu_{2} vs. H1:μ1>μ2H_{1}:\mu_{1} > \mu_{2}
    c) H0:μ1=μ2H_{0}:\mu_{1}=\mu_{2} vs. H1:μ1<μ2H_{1}:\mu_{1} < \mu_{2}
    ⇒ 유의수준: α\alpha=0.05, 검정통계량:T=(x1ˉx2ˉ)(μ1μ2)σ12/n1+σ22/n2T=\frac{(\bar{x_{1}}-\bar{x_{2}})-(\mu_{1}-\mu_{2})}{\sqrt{\sigma_{1}^2/n_{1}+\sigma_{2}^2/n_{2}}}~t(0,1)t(0,1)
    검정통계량 관측값: z0=x1ˉx2ˉσ12/n1+σ22/n2z_{0}=\frac{\bar{x_{1}}-\bar{x_{2}}}{\sqrt{\sigma_{1}^2/n_{1}+\sigma_{2}^2/n_{2}}}
    a) z0zα/2|z_{0}|\geq z_{\alpha/2} 이면 H0H_{0}기각
    b) z0zαz_{0}\geq z_{\alpha} 이면 H0H_{0}기각
    c) z0zαz_{0}\leq -z_{\alpha} 이면 H0H_{0}기각

.

2) 소표본 - 모분산을 모르는 경우

  • 가설
    a) H0:μ1=μ2H_{0}:\mu_{1}=\mu_{2} vs. H1:μ1μ2H_{1}:\mu_{1} \neq \mu_{2}
    b) H0:μ1=μ2H_{0}:\mu_{1}=\mu_{2} vs. H1:μ1>μ2H_{1}:\mu_{1} > \mu_{2}
    c) H0:μ1=μ2H_{0}:\mu_{1}=\mu_{2} vs. H1:μ1<μ2H_{1}:\mu_{1} < \mu_{2}
    ⇒ 유의수준: α\alpha=0.05
    Sp2=(n11)s12+(n21)s22n1+n22S_{p}^2=\frac{(n_{1}-1)s_{1}^2+(n_{2}-1)s_{2}^2}{n_{1}+n_{2}-2}
    ⇒ 검정통계량:T=(x1ˉx2ˉ)(μ1μ2)Sp/1/n1+1/n2T=\frac{(\bar{x_{1}}-\bar{x_{2}})-(\mu_{1}-\mu_{2})}{S_{p}/\sqrt{1/n_{1}+1/n_{2}}}~t(n1+n22)t(n_{1}+n_{2}-2)
  • 검정통계량 관측값: T=x1ˉx2ˉSp/1/n1+1/n2T=\frac{\bar{x_{1}}-\bar{x_{2}}}{S_{p}/\sqrt{1/n_{1}+1/n_{2}}}
    a) t0tα/2|t_{0}|\geq t_{\alpha/2} 이면 H0H_{0}기각
    b) t0tαt_{0}\geq t_{\alpha} 이면 H0H_{0}기각
    c) t0tαt_{0}\leq -t_{\alpha} 이면 H0H_{0}기각

.

3) 대응 비교

쌍으로 조사된 자료 (X1,Y1),(X2,Y2),...(Xi,Yi)(X_{1},Y_{1}), (X_{2},Y_{2}), ...(X_{i},Y_{i})가 주어졌을 때 XiX_{i}의 평균을 μx\mu_{x}, YiY_{i}의 평균을 μy\mu_{y}라고 하면 Di=XiYiD_{i}=X_{i}-Y_{i}으로 정의하고 가설은 아래와 같다.

  • 가설
    a) H0:μx=μyH_{0}:\mu_{x}=\mu_{y} vs. H1:μxμyH_{1}:\mu_{x} \neq \mu_{y}
    b) H0:μx=μyH_{0}:\mu_{x}=\mu_{y} vs. H1:μx>μyH_{1}:\mu_{x} > \mu_{y}
    c) H0:μx=μyH_{0}:\mu_{x}=\mu_{y} vs. H1:μx<μyH_{1}:\mu_{x} < \mu_{y}

    a) H0:μD=0H_{0}:\mu_{D}=0 vs. H1:μD0H_{1}:\mu_{D} \neq 0
    b) H0:μD=0H_{0}:\mu_{D}=0 vs. H1:μD>0H_{1}:\mu_{D} > 0
    c) H0:μD=0H_{0}:\mu_{D}=0 vs. H1:μD<0H_{1}:\mu_{D} < 0
    ⇒ 유의수준: α\alpha=0.05, 검정통계량 T=DμDSDnT=\frac{D-\mu_{D}}{S_{D}\sqrt{n}}~t(n1)t(n-1)
  • 검정통계량 관측값: T0=DμDSDnT_{0}=\frac{D-\mu_{D}}{S_{D}\sqrt{n}}
    a) t0tα/2|t_{0}|\geq t_{\alpha/2} 이면 H0H_{0}기각
    b) t0tαt_{0}\geq t_{\alpha} 이면 H0H_{0}기각
    c) t0tαt_{0}\leq -t_{\alpha} 이면 H0H_{0}기각
profile
안녕하세요, 데이터 공부를 하고 있습니다.

0개의 댓글