표본추출

choyunjeong·2024년 12월 12일

3.3 정규분포로부터의 표본추출

  • 실제 실험이나 연구에서 고려되는 확률변수는 여러 개의 중요한 요소들에 영향을 받음
  • 중심극한정리에 의하면 이들의 분포는 정규확률분포로 근사될 수 있음.
  • 모분포에 대한 정규성 가정은 통계적 추론에 필요한 분포이론의 수리적 접근 쉽게 가능.
  • 그러므로 정규분포에서 얻어진 표본과 그 함수들에 대한 성질을 파악하는 것은 통계적 추론 과정에 중요.

여기에서는 정규분포로부터 얻은 랜덤표본의 함수로 표현되는 확률변수들에 대해 살펴보았다.

정리 3.8
서로 독립인 확률변수 Xi (i=1,2,,n)X_i\ (i=1,2,\ldots,n)들이 정규분포 N(μi,σi2)N(\mu_i,\sigma_i^2)을 따르면, 그들의 합은 다음을 따른다.

i=1nXiN(i=1nμi, i=1nσi2)\sum_{i=1}^{n}X_i\sim N\left(\sum_{i=1}^{n}\mu_i,\ \sum_{i=1}^{n}\sigma_i^2\right)

\\[30pt]

[증명]

i=1nXi\sum_{i=1}^{n}X_i의 적률생성함수는

M(t)=E(etX)=E[et(X1+X2++Xn)]=E[etX1]E[etX2]E[etXn]=MX1(t)MX2(t)MXn(t)=i=1nexp(μit+σ2t2/2)=exp[ti=1nμi+(t2/2)i=1nσ2]\begin{aligned} M(t)&= E(e^{tX}) =E[e^{t(X_1+X_2+\cdots+X_n)}] \\[10pt] &=E[e^{tX_1}]E[e^{tX_2}]\cdots E[e^{tX_n}] \\[10pt] &=M_{X_1}(t)M_{X_2}(t)\cdots M_{X_n}(t) \\[5pt] &=\prod_{i=1}^n \exp(\mu_i t+\sigma^2t^2/2) \\[5pt] &=\exp\left[t\sum_{i=1}^{n}\mu_i+ (t^2/2)\sum_{i=1}^{n}\sigma^2\right] \end{aligned}

이 되는데 이는 바로 N(i=1nμi, i=1nσi2)N(\sum_{i=1}^{n}\mu_i,\ \sum_{i=1}^{n}\sigma_i^2)의 적률생성함수이다.
\\[30pt]

예 3.5
XN(6,22)X\sim N(6,2^2)이라고 할 때 10개 제품을 만드는데 걸리는 시간이 70이상일 확률을 구해보자. 각 제품을 만드는데 드는 시간은 독립이다.

P(i=110Xi70)=P(i=110Xi6040706040)P\left(\sum_{i=1}^{10}X_i\ge70\right)=P\left(\dfrac{\sum_{i=1}^{10}X_i-60}{\sqrt{40}}\ge\dfrac{70-60}{\sqrt{40}}\right)

\\[30pt]

표본평균과 표본분산의 관계 및 표본분포

Sn2=i=1n(XiXˉn)2(n1)S_n^2=\sum_{i=1}^{n}\dfrac{(X_i-\bar{X}_n)^2}{(n-1)}

\\[10pt]
i=1n(XiXnˉ)=0\sum_{i=1}^{n}(X_i-\bar{X_n})=0의 관계가 있으므로 (XiXnˉ)(X_i-\bar{X_n})들은 서로 독립이 아니며, 따라서 정규분포임에도 불구하고 표본분산의 분포를 구하는데 정리 3.5를 직접 사용 불가능하다는 점에서 다음 정리 3.9를 사용한다.

\\[30pt]

정리 3.9
X1,X2,,XnX_1,X_2,\ldots,X_n을 평균이 μ\mu이고 분산이 σ2\sigma^2인 정규분포 N(μ,σ2)N(\mu,\sigma^2)으로부터의 크기가 nn인 랜덤표본이라고 하면,

1)

XˉnSn2\bar{X}_n \perp S_n^2

2)

(n1)Sn2σ2χ2(n1),=Sn2σ2(n1)χ2(n1)\dfrac{(n-1)S_n^2}{\sigma^2}\sim\chi^2(n-1),\quad \\[15pt] = S_n^2\sim\dfrac{\sigma^2}{(n-1)}\cdot\chi^2(n-1)

[증명]
본문 p.158-159 참고

\\[20pt]

예 3.6
예3.5에서 10개의 랜덤표본의 표본분산이 5보다 클 확률을 구할 때 9Sn2/4χ(9)9\cdot S_n^2/4\sim \chi(9)이므로,

P(S1025)=P[9Sn24454]P(S_{10}^2\ge5)=P\left[\dfrac{9S_n^2}{4}\ge\dfrac{45}{4}\right]

정리 3.10

정리 3.11


[참고문헌]

  • 수리통계학 제 5판 - 송성주, 전명식

0개의 댓글