3.3 정규분포로부터의 표본추출
- 실제 실험이나 연구에서 고려되는 확률변수는 여러 개의 중요한 요소들에 영향을 받음
- 중심극한정리에 의하면 이들의 분포는 정규확률분포로 근사될 수 있음.
- 모분포에 대한 정규성 가정은 통계적 추론에 필요한 분포이론의 수리적 접근 쉽게 가능.
- 그러므로 정규분포에서 얻어진 표본과 그 함수들에 대한 성질을 파악하는 것은 통계적 추론 과정에 중요.
여기에서는 정규분포로부터 얻은 랜덤표본의 함수로 표현되는 확률변수들에 대해 살펴보았다.
정리 3.8
서로 독립인 확률변수 Xi (i=1,2,…,n)들이 정규분포 N(μi,σi2)을 따르면, 그들의 합은 다음을 따른다.
i=1∑nXi∼N(i=1∑nμi, i=1∑nσi2)
[증명]
∑i=1nXi의 적률생성함수는
M(t)=E(etX)=E[et(X1+X2+⋯+Xn)]=E[etX1]E[etX2]⋯E[etXn]=MX1(t)MX2(t)⋯MXn(t)=i=1∏nexp(μit+σ2t2/2)=exp[ti=1∑nμi+(t2/2)i=1∑nσ2]
이 되는데 이는 바로 N(∑i=1nμi, ∑i=1nσi2)의 적률생성함수이다.
예 3.5
X∼N(6,22)이라고 할 때 10개 제품을 만드는데 걸리는 시간이 70이상일 확률을 구해보자. 각 제품을 만드는데 드는 시간은 독립이다.
P(i=1∑10Xi≥70)=P(40∑i=110Xi−60≥4070−60)
표본평균과 표본분산의 관계 및 표본분포
Sn2=i=1∑n(n−1)(Xi−Xˉn)2
∑i=1n(Xi−Xnˉ)=0의 관계가 있으므로 (Xi−Xnˉ)들은 서로 독립이 아니며, 따라서 정규분포임에도 불구하고 표본분산의 분포를 구하는데 정리 3.5를 직접 사용 불가능하다는 점에서 다음 정리 3.9를 사용한다.
정리 3.9
X1,X2,…,Xn을 평균이 μ이고 분산이 σ2인 정규분포 N(μ,σ2)으로부터의 크기가 n인 랜덤표본이라고 하면,
1)
Xˉn⊥Sn2
2)
σ2(n−1)Sn2∼χ2(n−1),=Sn2∼(n−1)σ2⋅χ2(n−1)
[증명]
본문 p.158-159 참고
예 3.6
예3.5에서 10개의 랜덤표본의 표본분산이 5보다 클 확률을 구할 때 9⋅Sn2/4∼χ(9)이므로,
P(S102≥5)=P[49Sn2≥445]
정리 3.10
정리 3.11
[참고문헌]