표본 분포

choyunjeong·2024년 12월 12일

3.1 모집단과 표본

정의 3.2
확률변수 X1,X2,,XnX_1,X_2,\ldots,X_n의 결합 확률밀도함수 fX1,,Xn(x1,,xn)f_{X_1,\ldots,X_n}(x_1,\ldots,x_n)

fX1,,Xn(x1,,xn)=f(x1)f(x2)f(xn)f_{X_1,\ldots,X_n}(x_1,\ldots,x_n)=f(x_1)f(x_2)\ldots f(x_n)

의 꼴로 나타나면, X1,X2,,XnX_1,X_2,\ldots,X_n을 모확률밀도함수가 f()f(\cdot)이며 크기가 nn랜덤표본 또는 임의표본이라고 한다. 즉, 랜덤표본의 확률변수들은 독립이다.

\\[20pt]

예 3.1
모분포가 베르누이 확률변수는 f(x)=pxq1xf(x)=p^xq^{1-x}인 경우 서로 독립인 베르누이 시행을 10회 반복하였을 때의 표본을 X1,X2,,X10X_1,X_2,\ldots, X_{10}으로 표기하면, 이 표본의 결합 확률밀도함수는

fX1,,X10(x1,,x10)=f(x1)f(x2)f(x10)=pi=110xiq1i=110xi\begin{aligned} f_{X_1,\ldots,X_{10}}(x_1,\ldots,x_{10})&=f(x_1)f(x_2)\ldots f(x_{10}) \\[10pt] &=p^{\sum_{i=1}^{10}x_i}q^{1-\sum_{i=1}^{10}x_i} \end{aligned}

가 되며, X1,,X10X_1,\ldots,X_{10}을 모확률밀도함수가 f(x)=pxq1xf(x)=p^xq^{1-x}크기가 10의 랜덤표본이라고 한다.

\\[20pt]

정의 3.3
통계량 {T=T(X1,X2,,Xn)T=T(X_1,X_2,\ldots,X_n)}: 미지의 모수를 포함하지 않는 랜덤표본의 함수. (통계량도 확률변수이긴 함)

\\[20pt]

예 3.2
X1,X2,,XnX_1,X_2,\ldots,X_n이 확률밀도함수 f(x;θ)f(x;\theta), (θ\theta는 알려지지 않음)로부터 얻은 랜덤표본일 때 표본평균 또는 표본 최댓값

Xˉn=i=1nXinormax{X1,X2,,Xn}\bar{X}_n=\sum_{i=1}^{n}\dfrac{X_i}{n}\quad\text{or}\quad \text{max}\{X_1,X_2,\ldots,X_n\}

은 통계량이다. 그러나

Xnˉθormax{X1θ,X2θ,,Xnθ}\bar{X_n}-\theta\quad\text{or}\quad\text{max}\{\dfrac{X_1}{\theta},\dfrac{X_2}{\theta},\ldots,\dfrac{X_n}{\theta}\}

등은 미지의 모수 θ\theta에 의존하므로 통계량이 아니다.

\\[20pt]

정의 3.4
확률밀도함수 f(x;θ)f(x;\theta)로부터 크기가 nn인 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 얻었을 때, rr차 표본적률은

mr=1ni=1nXirm_r'=\dfrac{1}{n}\sum_{i=1}^{n}X_i^r

으로, 표본평균 Xˉn=1ni=1nXi/n\bar{X}_n=\frac{1}{n}\sum_{i=1}^{n}X_i/n에 대한 rr차 표본중심적률은

mr=1ni=1n(XiXˉn)rm_r=\dfrac{1}{n}\sum_{i=1}^{n}(X_i-\bar{X}_n)^r

으로 정의된다.

\\[20pt]

정리 3.1
평균과 분산이 각각μ\muσ2\sigma^2인 확률밀도함수 f(x)f(x)로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n의 표본평균과 표본분산

표본평균

Xˉn=1ni=1nXi\bar{X}_n=\dfrac{1}{n}\sum_{i=1}^{n}X_i

표본분산

Sn2=1n1i=1n(XXˉn)2S_n^2=\dfrac{1}{n-1}\sum_{i=1}^{n}(X-\bar{X}_n)^2

\\[20pt]
으로 표기하면 표본평균과 표본분산의 기댓값과 분산은 다음과 같다.

E(Xˉn)=μ,Var(Xˉn)=σ2nE(Sn2)=σ2,Var(Sn2)=1n(μ4n3n1σ4)\begin{aligned} &E(\bar{X}_n)=\mu,\quad \text{Var}(\bar{X}_n)=\dfrac{\sigma^2}{n} \\[15pt] &E(S_n^2)=\sigma^2,\quad \text{Var}(S_n^2)=\dfrac{1}{n}\left(\mu_4-\dfrac{n-3}{n-1}\sigma^4\right) \end{aligned}

[증명]

표본평균

E(Xˉn)=E(1ni=1nXi)=1n{i=1nE(Xi)}=1nnE(X)=μ\begin{aligned} E(\bar{X}_n)&=E(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n}\left\{\sum_{i=1}^{n}E(X_i)\right\} \\[15pt] &=\dfrac{1}{n}\cdot n\cdot E(X)=\mu \end{aligned}

\\[20pt]

Var(Xˉn)=Var(1ni=1nXi)=1n2Var(i=1nXi)=1n2i=1nVar(Xi)=nσ2n2=σ2n\begin{aligned} \text{Var}(\bar{X}_n) &=\text{Var}(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n^2}\text{Var}(\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n^2}\sum_{i=1}^{n}\text{Var}(X_i) \\[15pt] &=\dfrac{n\sigma^2}{n^2} \\[10pt] &=\dfrac{\sigma^2}{n} \end{aligned}

\\[20pt]

표본분산

E(Sn2)=E[1n1i=1n(XXˉn)2]=E[1n1i=1n(Xiμ+μXˉn)2]=E[1n1i=1n[(Xiμ)2+(μXˉn)2+2(Xiμ)(μXˉn)]]=1n1E[i=1n(Xiμ)2n(Xˉnμ)2]=1n1[i=1nE(Xiμ)2nE(Xˉnμ)2]=1n1[nσ2nσ2n]=σ2\begin{aligned} E(S_n^2) &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}(X-\bar{X}_n)^2\right] \\[15pt] &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\mu+\mu-\bar{X}_n)^2\right] \\[15pt] &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}[(X_i-\mu)^2+(\mu-\bar{X}_n)^2+2(X_i-\mu)(\mu-\bar{X}_n)]\right] \\[15pt] &=\dfrac{1}{n-1}E\left[\sum_{i=1}^{n}(X_i-\mu)^2-n(\bar{X}_n-\mu)^2\right] \\[15pt] &=\dfrac{1}{n-1}\left[\sum_{i=1}^{n}E(X_i-\mu)^2-nE(\bar{X}_n-\mu)^2\right] \\[15pt] &=\dfrac{1}{n-1}\left[n\sigma^2-n\dfrac{\sigma^2}{n}\right] \\[15pt] &=\sigma^2 \end{aligned}

[참고문헌]

  • 수리통계학 제 5판 - 송성주, 전명식

0개의 댓글