표집분포와 중심극한정리

yst3147·2022년 8월 13일

수리통계학

목록 보기
7/10

Wackerly et al., Mathematical Statistics with Applications을 읽고
책 내용을 정리하였습니다.

7.1 서론

통계량

아래 식에서 Yˉ\bar{Y}통계량(statistic)
Yˉ=(1/n)i=1nYi\bar{Y} = (1/n)\sum_{i=1}^{n}Y_i

통계량은 표본에서 관측할 수 있는 확률변수들과 알고 있는 상수의 함수

표집분포

모든 통계량은 확률변수이므로 그들의 표집분포(sampling distribution)라고 하는 확률분포를 가지고 있음

7.2 정규분포에 관련된 표집분포

정규분포에 관련된 표집분포

Y1,Y2,...,YnY_1, Y_2, ..., Y_n은 평균이 μ\mu이고 분산이 σ2\sigma^2인 정규분포에서의 크기 nn인 확률표본이라 하자
그러면
Yˉ=1ni=1nYi\bar{Y} = \frac{1}{n}\sum_{i=1}^nY_i
는 평균이 μYˉ=μ\mu_{\bar{Y}} = \mu이고 분산이 σyˉ2=σ2/n\sigma^2_{\bar{y}} = \sigma^2/n인 정규분포를 따른다.

독립인 표준정규확률변수들의 제곱의 합에 대한 표집분포

Y1,Y2,...,YnY_1, Y_2, ..., Y_n은 평균이 μ\mu이고 분산이 σ2\sigma^2인 정규분포에서의 크기 nn인 확률표본이라 하자
그러면 Zi=(Yiμ)/σ,i=1,2,...,nZ_i = (Y_i - \mu) / \sigma, i = 1,2,...,n는 독립이며, 표준정규확률변수이고
i=1nZi2=i=1n(Yiμσ)2\sum_{i=1}^nZ_i^2 = \sum_{i=1}^n(\frac{Y_i - \mu}{\sigma})^2
는 자유도가 nnχ2\chi^2분포를 따른다.

통계량 S2S^2의 함수에 대한 확률분포

Y1,Y2,...,YnY_1, Y_2, ..., Y_n은 평균이 uu이고 분산이 σ2\sigma^2인 정규분포에서의 확률표본이라고 하면
(n1)S2σ2=1σ2i=1n(YiYˉ)2\frac{(n-1)S^2}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^n(Y_i - \bar{Y})^2
는 자유도가 (n1)(n-1)χ2\chi^2분포를 따른다. 또한 yˉ\bar{y}S2S^2은 독립인 확률변수이다.

스튜던트 t분포

  • 간단히 t분포라고도 한다
  • ZZ는 표준정규확률변수이고 WW는 자유도가 ν\nuχ2\chi^2분포를 따르는 확률변수라고 하자.
    만일 Z와 W가 독립이면

    T=ZW/VT = \frac{Z}{\sqrt {W/V}}

는 자유도가 ν\nut 분포(t distribution)을 따른다고 한다.

  • 자유도가 n-1인 스튜던트 t 분포
    T=ZW/V=n(Yˉμ)/σ([(n1)S2/σ2]/(n1)=n(yˉμS)T = \frac{Z}{\sqrt {W/V}} = \frac{\sqrt{n}(\bar{Y} - \mu) / \sigma}{\sqrt{([(n-1)S^2/\sigma^2]/(n-1)}} = \sqrt{n}(\frac{\bar{y} - \mu}{S})

F분포

W1W_1W2W_2가 독립이며 자유도가 각각 ν1,ν2\nu_1, \nu_2χ2\chi^2 분포를 따르는 확률변수라 하자.
그러면

F=W1/ν1W2/ν2F = \frac{W_1/\nu_1}{W_2/\nu_2}
는 분자의 자유도가 ν1\nu_1이고 분모의 자유도가 ν2\nu_2인 F분포를 따른다고 한다.

  • 분자의 자유도가 (n11)(n_1 - 1), 분모의 자유도가 (n21)(n_2 - 1)인 F분포
    F=W1/ν1W2/ν2=([(n11)S2/σ2]/(n11)([(n21)S2/σ2]/(n21)=S12σ12S22σ22F = \frac{W_1/\nu_1}{W_2/\nu_2} = \frac{([(n_1-1)S^2/\sigma^2]/(n_1 - 1)}{([(n_2-1)S^2/\sigma^2]/(n_2 - 1)} = \frac{S_1^2 \sigma_1^2}{S_2^2 \sigma_2^2}

7.3 중심극한정리

중심극한정리

Y1,Y2,...YnY_1, Y_2, ... Y_nE(Y1)=μE(Y_1) = \mu이고 V(Y1)=σ2<V(Y_1) = \sigma^2 < \infin인 독립이며 동일하게 분포된 확률변수라 하자.

Un=i=1nYinμσn=yˉμσ/nU_n = \frac{\sum_{i=1}^{n}Y_i -n\mu}{\sigma\sqrt{n}} = \frac{\bar{y} - \mu}{\sigma/\sqrt{n}}, 여기서 yˉ=1ni=1nYi\bar{y} = \frac{1}{n}\sum_{i=1}^nY_i

로 정의하면
UnU_n의 분포함수는 nn이 무한으로 수렴할때 표준정규분포함수에 수렴한다.
즉 모든 μ\mu에 대해

limnP(Unμ)=μ12πet2/2dt\lim_{n \to \infty}P(U_n \leq \mu) = \int_{-\infin}^{\mu} \frac{1}{\sqrt{2\pi}}e^{-t^2/2} dt

7.4 중심극한정리의 증명(선택)

YYY1,Y2,Y3,...Y_1, Y_2, Y_3, ...은 각각 적률생성함수 m(t)m(t)m1(t),m2(t),m3(t),...m_1(t), m_2(t), m_3(t), ...를 갖는 확률변수라 하자
만일 모든 실수 tt에 대해
limnmn(t)=m(t)\lim_{n \to \infty}m_n(t) = m(t)
이면 nn \to \infty일 때 YnY_n의 분포함수는 YY의 분포함수에 수렴한다.

7.5 이항분포에 대한 정규근사

Un=Y/nU_n = Y/n의 평균은 μU=p\mu_U = p 분산은 σU2=p(1p)/n\sigma_U^2 = p(1-p)/n

7.6 요약

0개의 댓글