3.1 모집단과 표본
정의 3.2
확률변수 X1,X2,…,Xn의 결합 확률밀도함수 fX1,…,Xn(x1,…,xn)이
fX1,…,Xn(x1,…,xn)=f(x1)f(x2)…f(xn)
의 꼴로 나타나면, X1,X2,…,Xn을 모확률밀도함수가 f(⋅)이며 크기가 n인 랜덤표본 또는 임의표본이라고 한다. 즉, 랜덤표본의 확률변수들은 독립이다.
예 3.1
모분포가 베르누이 확률변수는 f(x)=pxq1−x인 경우 서로 독립인 베르누이 시행을 10회 반복하였을 때의 표본을 X1,X2,…,X10으로 표기하면, 이 표본의 결합 확률밀도함수는
fX1,…,X10(x1,…,x10)=f(x1)f(x2)…f(x10)=p∑i=110xiq1−∑i=110xi
가 되며, X1,…,X10을 모확률밀도함수가 f(x)=pxq1−x인 크기가 10의 랜덤표본이라고 한다.
정의 3.3
통계량 {T=T(X1,X2,…,Xn)}: 미지의 모수를 포함하지 않는 랜덤표본의 함수. (통계량도 확률변수이긴 함)
예 3.2
X1,X2,…,Xn이 확률밀도함수 f(x;θ), (θ는 알려지지 않음)로부터 얻은 랜덤표본일 때 표본평균 또는 표본 최댓값
Xˉn=i=1∑nnXiormax{X1,X2,…,Xn}
은 통계량이다. 그러나
Xnˉ−θormax{θX1,θX2,…,θXn}
등은 미지의 모수 θ에 의존하므로 통계량이 아니다.
정의 3.4
확률밀도함수 f(x;θ)로부터 크기가 n인 랜덤표본 X1,X2,…,Xn을 얻었을 때, r차 표본적률은
mr′=n1i=1∑nXir
으로, 표본평균 Xˉn=n1∑i=1nXi/n에 대한 r차 표본중심적률은
mr=n1i=1∑n(Xi−Xˉn)r
으로 정의된다.
정리 3.1
평균과 분산이 각각μ와 σ2인 확률밀도함수 f(x)로부터 랜덤표본 X1,X2,…,Xn의 표본평균과 표본분산
표본평균
Xˉn=n1i=1∑nXi
표본분산
Sn2=n−11i=1∑n(X−Xˉn)2
으로 표기하면 표본평균과 표본분산의 기댓값과 분산은 다음과 같다.
E(Xˉn)=μ,Var(Xˉn)=nσ2E(Sn2)=σ2,Var(Sn2)=n1(μ4−n−1n−3σ4)
[증명]
표본평균
E(Xˉn)=E(n1i=1∑nXi)=n1{i=1∑nE(Xi)}=n1⋅n⋅E(X)=μ
Var(Xˉn)=Var(n1i=1∑nXi)=n21Var(i=1∑nXi)=n21i=1∑nVar(Xi)=n2nσ2=nσ2
표본분산
E(Sn2)=E[n−11i=1∑n(X−Xˉn)2]=E[n−11i=1∑n(Xi−μ+μ−Xˉn)2]=E[n−11i=1∑n[(Xi−μ)2+(μ−Xˉn)2+2(Xi−μ)(μ−Xˉn)]]=n−11E[i=1∑n(Xi−μ)2−n(Xˉn−μ)2]=n−11[i=1∑nE(Xi−μ)2−nE(Xˉn−μ)2]=n−11[nσ2−nnσ2]=σ2
[참고문헌]