정규분포

choyunjeong·2024년 12월 25일

1. 확률밀도함수

XN(μ,σ2)X\sim N(\mu,\sigma^2)일 때 확률밀도함수는 다음과 같다.

f(x)=12πσexp[(xμ)2/2σ2](<x<)f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp[-(x-\mu)^2/2\sigma^2]\quad (-\infty<x<\infty)
  • 특징
    이와 같은 정규확률변수의 중요한 특징 중 하나는 선형변환을 하여도 역시 정규분포를 만족함.
    X N(μ,σ2)X~\sim N(\mu,\sigma^2)일 때, 선형변환된 Y=aX+bY=aX+b의 분포는 다음과 같이 구해진다.
    FY(y)=P(Yy)=P(aX+by)=P(Xyba)=yba12πσexp[(xμ)2/2σ2]dx=y12πaσexp[(t(aμ+b))/(22a2σ2)]dt(tba=x)\begin{aligned} F_Y(y) &=P(Y\leq y) \\[10pt] &=P(aX+b\leq y) \\[10pt] &=P(X\leq \dfrac{y-b}{a}) \\[10pt] &=\int_{-\infty}^{\frac{y-b}{a}}\dfrac{1}{\sqrt{2\pi}\sigma}\exp[-(x-\mu)^2/2\sigma^2]dx \\[10pt] &=\int_{-\infty}^{y}\dfrac{1}{\sqrt{2\pi}a\sigma}\exp[-(t-(a\mu+b))/(2^2a^2\sigma^2)]dt \quad (\because \dfrac{t-b}{a}=x) \\[10pt] \end{aligned}
    따라서 YY의 확률밀도함수는
    fY(y)=(d/dy)FY(y)=12πaσexp[(y(aμ+b))2a2/(22a2σ2)]\begin{aligned} f_Y(y) &=(d/dy)F_Y(y) \\[10pt] &=\dfrac{1}{\sqrt{2\pi}a\sigma}\exp[-(y-(a\mu+b))^2a^2/(2^2a^2\sigma^2)] \\[10pt] \end{aligned}
    이므로 YN(aμ+b,a2σ2)Y\sim N(a\mu+b,a^2\sigma^2)임을 알 수 있다.

\\[30pt]

2. 기댓값과 분산

XN(μ,σ2)X\sim N(\mu,\sigma^2)일 때 기댓값과 분은 다음과 같다.

1) 기댓값

E(X)=x12πσexp[12(xμσ)2]dx=(μ+σz)ϕ(z)dz(xba=z)=μϕ(z)dz+σzϕ(z)dz=μ\begin{aligned} E(X) &=\int_{-\infty}^{\infty}x\cdot\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{1}{2}\left(\dfrac{x-\mu}{\sigma}\right)^2\right]dx \\[10pt] &=\int_{-\infty}^{\infty}(\mu+\sigma z)\cdot\phi(z)dz \quad (\because \dfrac{x-b}{a}=z) \\[10pt] &=\mu\int_{-\infty}^{\infty}\phi(z)dz+\sigma\int_{-\infty}^{\infty}z\phi(z)dz \\[10pt] &=\mu \end{aligned}

\\[20pt]

2) 분산

E(X2)=x212πσexp[12(xμσ)2]dx=(μ+σz)2ϕ(z)dz=μ2ϕ(z)dz+2μσzϕ(z)dz+σ2z2ϕ(z)dz=μ2+σ2Var(X)=μ2+σ2μ2=σ2\begin{aligned} E(X^2) &=\int_{-\infty}^{\infty}x^2\cdot\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{1}{2}\left(\dfrac{x-\mu}{\sigma}\right)^2\right]dx \\[15pt] &=\int_{-\infty}^{\infty}(\mu+\sigma z)^2\cdot\phi(z)dz \\[15pt] &=\mu^2\int_{-\infty}^{\infty}\phi(z)dz+2\mu\sigma\int_{-\infty}^{\infty}z\phi(z)dz +\sigma^2\int_{-\infty}^{\infty}z^2\phi(z)dz \\[15pt] &=\mu^2+\sigma^2 \\[20pt] \therefore \text{Var}(X) &=\mu^2+\sigma^2 -\mu^2=\sigma^2 \end{aligned}

\\[20pt]

  • 참고
    σ2z2ϕ(z)dz=σ2[ϕ(z)+ϕ(z)]dz=σ2ϕ(z)dz=(d2/dz2)ϕ(z)dz=0\sigma^2\int_{-\infty}^{\infty}z^2\phi(z)dz=\sigma^2\int_{-\infty}^{\infty} [\phi''(z)+\phi'(z)]dz=\sigma^2 \\[15pt] \int_{-\infty}^{\infty}\phi''(z)dz=(d^2/dz^2)\int_{-\infty}^{\infty}\phi(z)dz=0

\\[30pt]

4. 적률생성함수

XN(μ,σ2)X\sim N(\mu,\sigma^2)일 때 적률생성함수는 다음과 같다.

MZ(t)=E(etx)=exp(tx)12πσexp[12(xμσ)2]dx=exp(t(μ+σz))12πexp(z2/2)dz(z=(xμ)σ)=eμteσz12πexp(z2/2)dz(z=(xμ)σ)=eμtMZ(σt)=exp(μt+12σ2t2)(MZ(t)=exp(t2/2))\begin{aligned} M_Z(t) &=E(e^{tx}) \\[10pt] &=\int_{-\infty}^{\infty}\exp(tx)\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{1}{2}\left(\dfrac{x-\mu}{\sigma}\right)^2\right] dx\\[15pt] &=\int_{-\infty}^{\infty}\exp(t(\mu+\sigma z))\dfrac{1}{\sqrt{2\pi}}\exp(-z^2/2) dz \quad \left(\because z=\dfrac{(x-\mu)}{\sigma}\right)\\[15pt] &=e^{\mu t}\int_{-\infty}^{\infty}e^{\sigma z}\dfrac{1}{\sqrt{2\pi}}\exp(-z^2/2) dz \quad \left(\because z=\dfrac{(x-\mu)}{\sigma}\right)\\[15pt] &=e^{\mu t}M_Z(\sigma t) \\[10pt] &=\exp(\mu t+\dfrac{1}{2}\sigma^2t^2)\quad (\because M_Z(t)=\exp(t^2/2)) \end{aligned}

따라서 적률생성함수를 활용한 기댓값과 분산은

  • 기댓값
    MX(1)(t)=(ddt)(exp(μt+12σ2t2))=exp(μt+12σ2t2)(μ+σ2t)E(X)=MX(1)(0)=μ\begin{aligned} M^{(1)}_X(t) &=\left(\dfrac{d}{dt}\right)\left(\exp(\mu t+\dfrac{1}{2}\sigma^2t^2)\right)= \exp(\mu t+\dfrac{1}{2}\sigma^2t^2)\cdot (\mu+\sigma^2t)\\[30pt] \therefore E(X) &=M^{(1)}_X(0)=\mu \end{aligned}

\\[20pt]

  • 분산
MX(2)(t)=(ddt)(exp(μt+12σ2t2)(μ+σ2t))=exp(μt+12σ2t2)[(μ+σ2t)2+σ2]MX(2)(0)=μ2+σ2Var(X)=MX(2)(0){MX(1)(0)}2=σ2\begin{aligned} M^{(2)}_X(t) &=\left(\dfrac{d}{dt}\right)\left(\exp(\mu t+\dfrac{1}{2}\sigma^2t^2)\cdot (\mu+\sigma^2t)\right) = \exp(\mu t+\dfrac{1}{2}\sigma^2t^2)\cdot [(\mu+\sigma^2t)^2+\sigma^2] \\[20pt] M^{(2)}_X(0)&=\mu^2+\sigma^2 \\[20pt] \therefore \text{Var}(X)&=M^{(2)}_X(0)-\left\{M^{(1)}_X(0)\right\}^2=\sigma^2 \end{aligned}

\\[30pt]

6. 표본분포의 근사

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 표본평균과 표본분산은 다음과 같다.

표본평균

E(Xˉn)=μ,Var(Xˉn)=σ2n(Xˉn=1ni=1nXi)E(\bar{X}_n)=\mu,\quad \text{Var}(\bar{X}_n)=\dfrac{\sigma^2}{n} \\[15pt] (\bar{X}_n=\dfrac{1}{n}\sum_{i=1}^{n}X_i)

\\[20pt]

표본분산

E(Sn2)=σ2,(Sn2=1n1i=1n(XXˉn)2)E(S_n^2)=\sigma^2,\quad (S_n^2=\dfrac{1}{n-1}\sum_{i=1}^{n}(X-\bar{X}_n)^2)

\\[20pt]

1) 대수의 법칙

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 표본평균은 모평균에 확률적으로 수렴한다.

Xˉnpμ\bar{X}_n \xrightarrow{p}\mu

\\[20pt]

P[Xnˉμ<ϵ]=P[Xnˉμ2<ϵ2]1E(Xnˉμ)2ϵ2=1σ2/nϵ21\begin{aligned} \because \quad P[|\bar{X_n}-\mu|<\epsilon] &=P[|\bar{X_n}-\mu|^2<\epsilon^2] \\[10pt] &\ge 1-\dfrac{E(\bar{X_n}-\mu)^2}{\epsilon^2} \\[10pt] &= 1-\dfrac{\sigma^2/n}{\epsilon^2}\rightarrow1 \end{aligned}

\\[20pt]

2) 중심극한정리

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 nn이 증가함에 따라 (표준)정규분포로 분포수렴한다.

Zn=n(Xˉnμ)dN(0, σ2)Zn=(Xˉnμ)σ2/ndN(0, 1)Zn=i=1n(Xiμ)nσdN(0, 1)\begin{aligned} Z_n&=\sqrt{n}(\bar{X}_n-\mu)\xrightarrow{d}N(0,\ \sigma^2) \\[20pt] Z_n&=\dfrac{(\bar{X}_n-\mu)}{\sqrt{\sigma^2/n}}\xrightarrow{d}N(0,\ 1) \\[20pt] Z_n&=\dfrac{\sum_{i=1}^{n}(X_i-\mu)}{\sqrt{n}\sigma}\xrightarrow{d}N(0,\ 1) \end{aligned}

\\[20pt]

3) 델타방법

확률변수 열 X1,X2,,Xn,X_1,X_2,\ldots,X_n,\ldots이 중심극한정리를 만족한다면

n(Xˉnμ)dN(0, σ2)\sqrt{n}(\bar{X}_n-\mu)\xrightarrow{d}N(0,\ \sigma^2)

이때 확률변수의 함수 g(μ)g(\mu)의 연속인 도함수 g(μ)g'(\mu)가 존재하고 0이 아니면

n(g(Xn)g(μ))dN(0,σ2[g(μ)]2)\sqrt{n}(g(X_n)-g(\mu))\xrightarrow{d}N(0,\sigma^2[g'(\mu)]^2)

이 성립하며 이를 델타 방법이라한다.

이제 함수 g(x)=x2g(x)=x^2를 고려하면 g(μ)=μ2g(\mu)=\mu^2, σ2=σ2\sigma^2=\sigma^2, g(λ)=2μg'(\lambda)=2\mu이므로

n(Xˉn2μ2)dN(0,4μ2σ2)\sqrt{n}(\bar{X}_n^2-\mu^2)\xrightarrow{d}N(0,4\mu^2\sigma^2)

\\[30pt]

7. 추정량

1) 적률 추정량

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,,XnX_1,\ldots,X_n을 구했을 때, μ\muσ2\sigma^2을 적률을 사용하는 방법으로 추정.

1) μ^\hat{\mu}추정

m1=μ1(μ,σ2)=μi=1nXi1/n=μ^μ^=Xˉn\begin{aligned} m_1'&=\mu_1'(\mu,\sigma^2)=\mu \\[10pt] \rightarrow \sum_{i=1}^{n}X_i^1/n &= \hat{\mu} \\[15pt] \therefore \hat{\mu} &= \bar{X}_n \end{aligned}

2) σ^2\hat{\sigma}^2추정

m2=μ2(μ,σ2)=μ2+σ2i=1nXi2/n=μ^2+σ^2σ^2=i=1nXi2/nμ^2=i=1nXi2/n(Xˉn)2( μ^=Xˉn)=i=1nXi2n(Xˉn)2n=i=1nXi2i=1n(Xˉn)2n=i=1n(XiXˉn)2n( E[X2][E[X]]2=E[XE(X)]2)\begin{aligned} m_2'&=\mu_2'(\mu,\sigma^2)=\mu^2+\sigma^2 \\[10pt] \rightarrow \sum_{i=1}^{n}X_i^2/n &= \hat{\mu}^2 + \hat{\sigma}^2\\[10pt] \therefore \hat{\sigma}^2 &= \sum_{i=1}^{n}X_i^2/n - \hat{\mu}^2 \\[15pt] &=\sum_{i=1}^{n}X_i^2/n-\left(\bar{X}_n\right)^2 \quad \left(\because\ \hat{\mu}=\bar{X}_n\right) \\[15pt] &=\dfrac{\sum_{i=1}^{n}X_i^2-n\left(\bar{X}_n\right)^2}{n} \\[10pt] &=\dfrac{\sum_{i=1}^{n}X_i^2-\sum_{i=1}^{n}\left(\bar{X}_n\right)^2}{n} \\[10pt] &=\dfrac{\sum_{i=1}^{n}\left(X_i-\bar{X}_n\right)^2}{n} \quad \left(\because\ E[X^2]-[E[X]]^2=E[X-E(X)]^2\right) \end{aligned}

\\[20pt]

2) 최대가능도 추정량

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때, μ\muσ2\sigma^2의 최대가능도 추정량은 로그 가능도함수의 미분을 이용하여 다음과 같이 구한다.

우선 가능도함수는

L(μ,σ2;x1,x2,,xn)=i=1nf(xi;μ,σ2)=1(2πσ2)n/2exp[i=1n(xiμ)2/2σ2]\begin{aligned} L(\mu,\sigma^2;x_1,x_2,\ldots,x_n)&=\prod_{i=1}^{n}f(x_i;\mu,\sigma^2)\\[10pt] &=\dfrac{1}{(2\pi\sigma^2)^{n/2}}\exp\left[\sum_{i=1}^{n}(x_i-\mu)^2/2\sigma^2\right] \end{aligned}

가 되며, 로그가능도함수는

logL(μ,σ2;x1,x2,,xn)=log{1(2πσ2)n/2}+log{exp[i=1n(xiμ)2/2σ2]}=(n/2)log(2πσ2)i=1n(xiμ)2/2σ2\begin{aligned} \text{log}L(\mu,\sigma^2;x_1,x_2,\ldots,x_n) &=\text{log}\left\{\dfrac{1}{(2\pi\sigma^2)^{n/2}}\right\}+ \text{log}\left\{\exp\left[\sum_{i=1}^{n}(x_i-\mu)^2/2\sigma^2\right]\right\}\\ &=-(n/2)\text{log}(2\pi\sigma^2) - \sum_{i=1}^{n}(x_i-\mu)^2/2\sigma^2 \end{aligned}

가 된다. 이 로그가능도함수를 최대화하기 위해 각각 (μ,σ2)(\mu,\sigma^2)로 미분한 후

1)ddμlogL(μ,σ2;x1,x2,,xn)=ddμ{(n/2)log(2πσ2)i=1n(xiμ)2/2σ2}=i=1n(xiμ)σ2(1)\begin{aligned} 1)\quad \dfrac{d}{d\mu}\text{log}L(\mu,\sigma^2;x_1,x_2,\ldots,x_n) &=\dfrac{d}{d\mu}\{ -(n/2)\text{log}(2\pi\sigma^2) - \sum_{i=1}^{n}(x_i-\mu)^2/2\sigma^2\} \\[10pt] &=-\sum_{i=1}^{n}\dfrac{(x_i-\mu)}{\sigma^2} \end{aligned} \tag{1}

\\[20pt]

2)ddσ2logL(μ,σ2;x1,x2,,xn)=ddμ{(n/2)log(2πσ2)i=1n(xiμ)2/2σ2}=n22π2πσ22i=1n(xiμ)24σ4=n2σ2+i=1n(xiμ)22σ4(2)\begin{aligned} 2)\quad \dfrac{d}{d\sigma^2}\text{log}L(\mu,\sigma^2;x_1,x_2,\ldots,x_n) &=\dfrac{d}{d\mu}\{ -(n/2)\text{log}(2\pi\sigma^2) - \sum_{i=1}^{n}(x_i-\mu)^2/2\sigma^2\} \\[10pt] &=-\dfrac{n}{2}\dfrac{2\pi}{2\pi\sigma^2}-\dfrac{2\cdot\sum_{i=1}^{n}(x_i-\mu)^2}{4\sigma^4} \\[10pt] &=-\dfrac{n}{2\sigma^2}+\dfrac{\sum_{i=1}^{n}(x_i-\mu)^2}{2\sigma^4} \tag{2} \end{aligned}

두 연립방정식의 해를 구하여 μ,σ2\mu,\sigma^2의 최대가능도 추정량을 계산한다.

1)ddμlogL(μ,σ2;x1,x2,,xn)=i=1n(xiμ)σ2=0=i=1n(xiμ)=0=nμ=i=1nxiμ=Xnˉ\begin{aligned} 1)\quad \dfrac{d}{d\mu}\text{log}L(\mu,\sigma^2;x_1,x_2,\ldots,x_n) &=\sum_{i=1}^{n}\dfrac{(x_i-\mu)}{\sigma^2}=0 \\[10pt] &=\sum_{i=1}^{n}(x_i-\mu)=0 \\[10pt] &= n\mu=\sum_{i=1}^{n}x_i \\[15pt] &\therefore \mu= \bar{X_n} \end{aligned}

\\[20pt]

2)ddσ2logL(μ,σ2;x1,x2,,xn)=n2σ2+i=1n(xiμ)22σ4=0=i=1n(xiμ)22σ4=n2σ2=i=1n(xiμ)2=nσ2σ2=i=1n(XiXˉ)2/n\begin{aligned} 2)\quad \dfrac{d}{d\sigma^2}\text{log}L(\mu,\sigma^2;x_1,x_2,\ldots,x_n) &=-\dfrac{n}{2\sigma^2}+\dfrac{\sum_{i=1}^{n}(x_i-\mu)^2}{2\sigma^4}=0 \\[10pt] &=\dfrac{\sum_{i=1}^{n}(x_i-\mu)^2}{2\sigma^4}=\dfrac{n}{2\sigma^2} \\[10pt] &=\sum_{i=1}^{n}(x_i-\mu)^2=n\sigma^2 \\[10pt] &\therefore \sigma^2 = \sum_{i=1}^{n}(X_i-\bar{X})^2/n \end{aligned}

따라서 최대 가능도 추정량은 다음과 같다.

(μ,σ2)=(Xnˉ, i=1n(XiXˉ)2/n)(\mu,\sigma^2)=\left(\bar{X_n},\ \sum_{i=1}^{n}(X_i-\bar{X})^2/n\right)

\\[30pt]

최대가능도 추정량의 불변성

정규분포에서 얻어진 랜덤표본으로 표준편차 σ\sigma의 최대가능도 추정량을 구할 때, σ2\sigma^2을 모수로 두는 것이 미분이 좀 더 쉽다고 한다면 σ2\sigma^2의 최대가능도를 먼저 구하고, 여기에 제곱근을 취하여 σ\sigma의 최대가능도 추정량을 구할 수 있다.

정규분포로부터 σ2\sigma^2의 최대가능도 추정량은 σ^2=i=1n(XiXˉn)/n\hat{\sigma}^2=\sum_{i=1}^{n}(X_i-\bar{X}_n)/n이다. 이제 g(σ2)=σg(\sigma^2)=\sigma의 최대가능도 추정량은

g(σ^2)=σ^=i=1n(XiXˉn)/ng(\hat{\sigma}^2)=\hat{\sigma}=\sqrt{\sum_{i=1}^{n}(X_i-\bar{X}_n)/n}

이다.

\\[30pt]

8. 좋은 추정량 조건

최대가능도 추정량인 경우만 고려하였다.

1) 비편향추정량

X1,X2,,XnX_1,X_2,\ldots,X_{n}N(μ,σ2)N(\mu,\sigma^2)으로부터 얻은 랜덤표본이라고 할 때 최대가능도 추정량의 기댓값은 E[Xˉn]=μE[\bar{X}_n]=\mu이므로 이 추정량은 비편향추정량이다.

E[T(X)]g(μ)=E[Xˉn]μ=μμ=0\begin{aligned} E[T(X)]-g(\mu) &=E[\bar{X}_n]-\mu \\[5pt] &=\mu-\mu \\[5pt] &=0 \end{aligned}
E(Xˉn)=E(1ni=1nXi)=1n{i=1nE(Xi)}=1nnE(X)=μ\begin{aligned} E(\bar{X}_{n})&=E(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n}\left\{\sum_{i=1}^{n}E(X_i)\right\} \\[15pt] &=\dfrac{1}{n}\cdot n\cdot E(X)=\mu \end{aligned}

\\[20pt]

2) 최소분산 비편향추정량

2-1. 크래머-라오 방법

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 비편향 추정량인 최대 가능도 추정량의 분산에 대한 부등식은 다음과 같이 주어진다.

Var(Xˉn)[g(μ)]2nI(μ)\text{Var}(\bar{X}_n)\ge\dfrac{[g'(\mu)]^2}{nI(\mu)}

T(X)T(X)g(θ)g(\theta)형태가 아닌 θ\theta의 비편향추정량이라고 한다면 위 정리로부터

Var(Xˉn)1nI(μ)\text{Var}(\bar{X}_n)\ge\dfrac{1}{nI(\mu)}

을 얻을 수 있다. 그러므로 어떤 비편향추정량 Xˉn\bar{X}_n의 분산이 1nI(μ)\dfrac{1}{nI(\mu)}이라면 이 추정량은 μ\mu의 최소분산 비편향추정량이다.
\\[10pt]

이 때 피셔의 정보량 I(θ)I(\theta)은 다음과 같고

I(θ)=E[(θlog f(X;θ))2]=E[(2θ2log f(X;θ))]I(\theta)=E\left[\left(\dfrac{\partial}{\partial\theta}\text{log }f(X;\theta)\right)^2\right]=-E\left[\left(\dfrac{\partial^2}{\partial\theta^2}\text{log }f(X;\theta)\right)\right]

우선 (μlog f(X;μ))2\left(\dfrac{\partial}{\partial \mu}\text{log }f(X;\mu)\right)^2계산을 하면

f(X;μ)=(2πσ0)1exp[12(Xμσ0)2]log f(X;μ)=log (2πσ0)1+[12(Xμσ0)2]μlog f(X;μ)=[212(Xμσ0)](Xμσ0)=Xμσ02\begin{aligned} f(X;\mu) &=(\sqrt{2\pi}\sigma_0)^{-1}\exp\left[-\dfrac{1}{2}\cdot\left(\dfrac{X-\mu}{\sigma_0}\right)^2\right] \\[15pt] \text{log }f(X;\mu) &=\text{log }(\sqrt{2\pi}\sigma_0)^{-1}+\left[-\dfrac{1}{2}\cdot\left(\dfrac{X-\mu}{\sigma_0}\right)^2\right] \\[15pt] \dfrac{\partial}{\partial\mu}\text{log }f(X;\mu) &=\left[-2\cdot\dfrac{1}{2}\cdot\left(\dfrac{X-\mu}{\sigma_0}\right)\right]\left(\dfrac{X-\mu}{\sigma_0}\right)^{'} \\[15pt] &=\dfrac{X-\mu}{\sigma_0^2} \end{aligned}

따라서

I(μ)=E[(μlog f(X;μ))2]=E[Xμσ02]2=E[Xμ]2σ04=σ02σ04=1σ02\begin{aligned} I(\mu) &=E\left[\left(\dfrac{\partial}{\partial\mu}\text{log }f(X;\mu)\right)^2\right] \\[15pt] &=E\left[\dfrac{X-\mu}{\sigma_0^2}\right]^2 \\[15pt] &=\dfrac{E\left[X-\mu\right]^2}{\sigma_0^4} \\[15pt] &=\dfrac{\sigma_0^2}{\sigma_0^4} \\[15pt] &=\dfrac{1}{\sigma_0^2} \end{aligned}

이다. 그러므로

Var(Xˉn)=1nI(μ)=σ2/n\text{Var}(\bar{X}_n)=\dfrac{1}{nI(\mu)}=\sigma^2/n이므로 표본평균 Xˉn\bar{X}_n는 최소분산 비편향추정량이다.

\\[20pt]

3) 일치추정량

추정량이 일치성을 가질 조건을 평균제곱오차를 이용하여 표현할 수 있다.

Tn(X)T_n(X)g(θ)g(\theta)의 추정량이라고 할 때, 모든 θΩ\theta\in\Omega에 대하여

limnE[Tn(X)g(θ)]2=0\lim_{n\rightarrow\infty}E[T_n(X)-g(\theta)]^2=0

이 성립하면, Tn(X)T_n(X)는 일치성이 있다고 볼볼 수 있다. 그런데 이 때

MSE(Tn)=Var(Tn)+[E(Tn)g(θ)]2\text{MSE}(T_n)=\text{Var}(T_n)+[E(T_n)-g(\theta)]^2

이므로 TnT_ng(θ)g(\theta)의 비편향추정량인 경우 limnVar(Tn)=0\lim_{n\rightarrow\infty}\text{Var}(T_n)=0이 성립하면 추정량 TnT_n의 일치성이 보장된다. (정리 4.9참조)

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 최대가능도 추정량 Xˉn\bar{X}_n은 비편향추정량이므로 MSE\text{MSE}는 0이다. 또한 nn이 증가할 때 Var(Xˉn)\text{Var}(\bar{X}_n)

limnVar(Xˉn)=limnσ2n=0\lim_{n\rightarrow\infty}\text{Var}(\bar{X}_n)=\lim_{n\rightarrow\infty}\dfrac{\sigma^2}{n}=0

으로

MSE(Xˉn)=Var(Xˉn)=0\text{MSE}(\bar{X}_n)=\text{Var}(\bar{X}_n)=0

이므로 Xˉn\bar{X}_n는 일치추정량이다.

\\[30pt]

9. 구간추정

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 다음과 같이 신뢰구간을 중심극한정리를 이용하여 다음과 같이 근사적으로 구할 수 있다.

1) 정규분포의 모평균에 대한 신뢰구간

모분산이 알려진 경우

n(Xˉnμ)/σ\sqrt{n}(\bar{X}_n-\mu)/\sigma의 분포는 N(0,1)N(0,1)으로서 모수에 의존하지 않으므로 추축변량임.

P[zα/2n(Xˉnμ)σzα/2]=P[Xˉnzα/2σnμXˉn+zα/2σn]=1α\begin{aligned} P&\left[-z_{\alpha/2}\le \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{\sigma}\le z_{\alpha/2}\right] \\[15pt] =P&\left[\bar{X}_n-z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}} \le \mu\le \bar{X}_n+z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}} \right] \\[15pt] =1&-\alpha \end{aligned}

\\[30pt]

모분산이 알려져 있지 않은 경우
모분산을 아는 경우와 달리 σ2\sigma^2에 의존하기 때문에 사용할 수 없다. 따라서 Sn2=i=1n(XiXˉn)2/(n1)S_n^2=\sum_{i=1}^{n}(X_i-\bar{X}_n)^2/(n-1)으로 추정한 추축변량 n(Xˉnμ)/Sn\sqrt{n}(\bar{X}_n-\mu)/S_n이 자유도가 (n1)(n-1)tt분포를 가지는 점을 이용하여 다음과 같이 구한다.

P[tα/2(n1)n(Xˉnμ)Sntα/2(n1)]=P[Xˉntα/2(n1)σnμXˉn+tα/2(n1)σn]=1α\begin{aligned} P&\left[-t_{\alpha/2}(n-1)\le \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{S_n}\le t_{\alpha/2}(n-1)\right] \\[15pt] =P&\left[\bar{X}_n-t_{\alpha/2}(n-1)\dfrac{\sigma}{\sqrt{n}} \le \mu\le \bar{X}_n+t_{\alpha/2}(n-1)\dfrac{\sigma}{\sqrt{n}} \right] \\[15pt] =1&-\alpha \end{aligned}

\\[20pt]

신뢰구간은 xˉn\bar{x}_n에 대해 대칭이며, 길이는 모분산 σ2\sigma^2이 작을수록 또 표본의 크기 nn이 커질수록 짧아짐을 볼 수 있다.

\\[30pt]

2) 정규분포의 모분산에 대한 신뢰구간

모평균이 알려진 경우
i=1n(Xiμ)/σ2\sum_{i=1}^{n}(X_i-\mu)/\sigma^2이 자유도가 (n)(n)인 카이제곱 분포를 따르는 추축변량인 점에 근거하여 다음과 같이 구한다.

P[χ1α/22(n)n(Xˉnμ)σ2χα/22(n)]=P[i=1n(Xˉiμ2)χα/22(n)σ2i=1n(Xˉiμ2)χ1α/22(n)]=1α\begin{aligned} P&\left[\chi^2_{1-\alpha/2}(n)\le \dfrac{\sqrt{n}(\bar{X}_n-\mu)}{\sigma^2}\le \chi^2_{\alpha/2}(n)\right] \\[15pt] =P&\left[\dfrac{\sum_{i=1}^{n}(\bar{X}_i-\mu^2)}{\chi^2_{\alpha/2}(n)} \le \sigma^2 \le \dfrac{\sum_{i=1}^{n}(\bar{X}_i-\mu^2)}{\chi^2_{1-\alpha/2}(n)} \right] \\[15pt] =1&-\alpha \end{aligned}

\\[30pt]

모평균이 알려져 있지 않은 경우
μ\mu를 표본평균 Xˉn\bar{X}_n로 추정한 통계량 (n1)Sn2/σ2=i=1n(XiXˉn)/σ2(n-1)S_n^2/\sigma^2=\sum_{i=1}^{n}(X_i-\bar{X}_n)/\sigma^2이 자유도가 (n1)(n-1)인 카이제곱 분포를 따르는 추축변량인 점에 근거하여 다음과 같이 구한다.

P[χ1α/22(n1)n(XˉnXˉn)σ2χα/22(n1)]=P[i=1n(XˉiXˉn2)χα/22(n1)σ2i=1n(XˉiXˉn2)χ1α/22(n1)]=1α\begin{aligned} P&\left[\chi^2_{1-\alpha/2}(n-1)\le \dfrac{\sqrt{n}(\bar{X}_n-\bar{X}_n)}{\sigma^2}\le \chi^2_{\alpha/2}(n-1)\right] \\[15pt] =P&\left[\dfrac{\sum_{i=1}^{n}(\bar{X}_i-\bar{X}_n^2)}{\chi^2_{\alpha/2}(n-1)} \le \sigma^2 \le \dfrac{\sum_{i=1}^{n}(\bar{X}_i-\bar{X}_n^2)}{\chi^2_{1-\alpha/2}(n-1)} \right] \\[15pt] =1&-\alpha \end{aligned}

\\[30pt]

10. 가설검정

1) 최강력 검정법 (네이만-피어슨 방법)

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n이라 하고 다음 가설 검정을 한다.

H0:μ=μ0vsH0:μ=μ1(>μ0)H_0:\mu = \mu_0\quad\text{vs}\quad H_0:\mu = \mu_1(>\mu_0)

에 대한 가능도비는 다음과 같이 주어진다.

LR(μ0,μ1;x1,x2,,xn)=(2π)n/2exp[i=1n(xiμ0)2/2](2π)n/2exp[i=1n(xiμ1)2/2]=exp[i=1n(xiμ0)2/2+i=1n(xiμ1)2/2]=exp[n(μ1μ0)xˉnn(μ02μ12)/2]\begin{aligned} LR(\mu_0,\mu_1;x_1,x_2,\ldots,x_n) &=\dfrac{(2\pi)^{-n/2}\exp\left[-\sum_{i=1}^{n}(x_i-\mu_0)^2/2\right]}{(2\pi)^{-n/2}\exp\left[-\sum_{i=1}^{n}(x_i-\mu_1)^2/2\right]} \\[15pt] &=\exp\left[-\sum_{i=1}^{n}(x_i-\mu_0)^2/2+\sum_{i=1}^{n}(x_i-\mu_1)^2/2\right] \\[15pt] &=\exp\left[-n(\mu_1-\mu_0)\bar{x}_n-n(\mu_0^2-\mu_1^2)/2\right] \end{aligned}

그런데 μ1μ0>0\mu_1-\mu_0>0이고 μ02μ12\mu_0^2-\mu_1^2은 상수이므로 따라서 LR(μ0,μ1;x1,x2,,xn)kLR(\mu_0,\mu_1;x_1,x_2,\ldots,x_n)\le k가 성립하는 것은 xˉnk1\bar{x}_n\ge k_1이 성립함과 동일하다. 이제 네이만-피어슨 정리에 의해 최강렵 검정법의 기각영역은

C={(x1,x2,,xn):xˉnk1}C=\{(x_1,x_2,\ldots,x_n):\bar{x}_n\ge k_1\}

의 꼴로 주어진다. 가설에 대한 유의수준 α\alpha인 기각영역은

P(Xˉnk1μ0)=αP(\bar{X}_n\ge k_1|\mu_0)=\alpha

를 만족하고, n(Xˉμ0)\sqrt{n}(\bar{X}-\mu_0)은 귀무가설 H0H_0하에서 N(0,1)N(0,1)을 따르므로

P(Xˉnk1μ0)=P(n(Xˉμ0)n(k1μ0)μ0)=αP(\bar{X}_n\ge k_1|\mu_0)=P(\sqrt{n}(\bar{X}-\mu_0)\ge \sqrt{n}(k_1-\mu_0)|\mu_0)=\alpha

로부터 n(k1μ0)=zα\sqrt{n}(k_1-\mu_0)=z_{\alpha}, 즉 기각영역은

C={(x1,x2,,xn):xˉnμ+zα/n}C=\{(x_1,x_2,\ldots,x_n):\bar{x}_n\ge \mu+z_{\alpha}/\sqrt{n}\}

이 된다.

\\[20pt]

2) 균일 가능도비 검정법

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n이라 하고

H0:μμ0vsH0:μ>μ0H_0:\mu\le \mu_0\quad\text{vs}\quad H_0:\mu > \mu_0

고려해보자. μ1<μ2\mu_1<\mu_2일 때 가능도비는 다음과 같이 주어진다.

LR(μ1,μ2;x1,x2,,xn)=(2π)n/2exp[i=1n(xiμ1)2/2](2π)n/2exp[i=1n(xiμ2)2/2]=exp[i=1n(xiμ1)2/2+i=1n(xiμ2)2/2]=exp[(μ2μ1)i=1nxi2+n(μ22μ12)/2]\begin{aligned} LR(\mu_1,\mu_2;x_1,x_2,\ldots,x_n) &=\dfrac{(2\pi)^{-n/2}\exp\left[-\sum_{i=1}^{n}(x_i-\mu_1)^2/2\right]}{(2\pi)^{-n/2}\exp\left[-\sum_{i=1}^{n}(x_i-\mu_2)^2/2\right]} \\[15pt] &=\exp\left[-\sum_{i=1}^{n}(x_i-\mu_1)^2/2+\sum_{i=1}^{n}(x_i-\mu_2)^2/2\right] \\[15pt] &=\exp\left[-(\mu_2-\mu_1)\sum_{i=1}^{n}x_i^2+n(\mu_2^2-\mu_1^2)/2\right] \end{aligned}

따라서 이 경우 가능도함수는 T(x1,x2,,xn)=i=1nxiT(x_1,x_2,\ldots,x_n)=\sum_{i=1}^{n}x_i에 대해 비증가인 단조가능도비 성격을 가진다. 그러므로 가설에 대한 유의수준 α\alpha인 균일최강력 검정법은 그 기각영역이

C={(x1,x2,,xn):i=1nxik}C=\{(x_1,x_2,\ldots,x_n):\sum_{i=1}^{n}x_i\ge k\}

로 주어지며, 상수 kkP(i=1nxikλ0)=αP(\sum_{i=1}^{n}x_i\ge k|\lambda_0)=\alpha에 의해 결정된다. 즉, k=nμ0+nz0k=n\mu_0+\sqrt{n}z_0가 된다. (예 5.11)

로 주어지며, 상수 kk는 유의수준이 α=P(i=1nxikλ0)\alpha=P(\sum_{i=1}^{n}x_i\ge k|\lambda_0)의해 결정된다. 구체적인 기각영역을 구하기 위해서는 중심극한정리에 의해

P(i=1nxikλ0)=P[i=1nxiE[i=1nxi]Var(i=1nxi)kE[i=1nxi]Var(i=1nxi)μ0]=P[i=1nxinμ0nσ2knμ0nσ2μ0]P(Zknμ0nσ2)=α\begin{aligned} P(\sum_{i=1}^{n}x_i\ge k|\lambda_0) &=P\left[\left.\dfrac{\sum_{i=1}^{n}x_i - E[\sum_{i=1}^{n}x_i]}{\sqrt{\text{Var}(\sum_{i=1}^{n}x_i)}}\ge\dfrac{k - E[\sum_{i=1}^{n}x_i]}{\sqrt{\text{Var}(\sum_{i=1}^{n}x_i)}}\right|\mu_0\right] \\[15pt] &=P\left[\left.\dfrac{\sum_{i=1}^{n}x_i-n\mu_0}{\sqrt{n\sigma^2}}\ge\dfrac{k-n\mu_0}{\sqrt{n\sigma^2}}\right|\mu_0\right] \\[15pt] &\approx P\left(Z\ge\dfrac{k-n\mu_0}{\sqrt{n\sigma^2}}\right) \\[15pt] &=\alpha \end{aligned}

가 성립하므로, (knμ0)/nσ2=zα(k-n\mu_0)/\sqrt{n\sigma^2}=z_{\alpha}이다. 즉, 기각 영역은 다음과 같다.

가 성립하므로, k=nμ0+zαnσ2k=n\mu_0+z_{\alpha}\sqrt{n\sigma^2}이다. 즉, 기각 영역은 다음과 같다.

C={(x1,x2,,xn):i=1nxinμ0+zαnσ2}C=\{(x_1,x_2,\ldots,x_n):\sum_{i=1}^{n}x_i\ge n\mu_0+z_{\alpha}\sqrt{n\sigma^2}\}

\\[20pt]

3) 일반화 가능도비 검정법

XN(μ,σ2)X\sim N(\mu,\sigma^2)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때, 모분산 σ2\sigma^2 알려져 있는 경우

H0:μ=μ0vsH1:μμ0H_0:\mu=\mu_0\quad\text{vs}\quad H_1:\mu\neq\mu_0

을 고려해보자. 가능도함수가 T(X1,X2,,Xn)=i=1nXiT(X_1,X_2,\ldots,X_n)=\sum_{i=1}^{n}X_i에 대해 비증가하는 단조가능도비의 성질이 있으므로 대립가설이 H1:μ>μ0H_1:\mu>\mu_0이면 균일최강력 검정법의 기각영역이 {i=1nXik}\{\sum_{i=1}^{n}X_i\ge k\}의 형태를 가지고 대립가설이 H1:μ<μ0H_1:\mu<\mu_0이면 균일최강력 검정법의 기각영역이 {i=1nXik}\{\sum_{i=1}^{n}X_i\le k\}의 형태를 갖는다. 그러나 최강력 검정법의 기각영역이 μμ0\mu-\mu_0의 부호에 의존하므로 대립가설이 H1:μμ0H_1:\mu\neq\mu_0이면 균일최강력 검정법이 존재하지 않는다.

이제 양측 대립가설에 대해 일반화 가능도비 검정법의 기각영역을 구해 보자. μ\mu의 최대가능도 추정량이 Xˉn\bar{X}_n이므로 일반화 가능도비는

Λ(X1,X2,,Xn)=(2πσ2)n/2exp[i=1n(Xiμ)2/(2σ2)](2πσ2)n/2exp[i=1n(XiXˉn)2/(2σ2)]=exp(n2σ2(Xˉnμ)2)\begin{aligned} \Lambda(X_1,X_2,\ldots,X_n) &=\dfrac{(2\pi\sigma^2)^{-n/2}\exp\left[-\sum_{i=1}^{n}(X_i-\mu)^2/(2\sigma^2)\right]}{(2\pi\sigma^2)^{-n/2}\exp\left[-\sum_{i=1}^{n}(X_i-\bar{X}_n)^2/(2\sigma^2)\right]} \\[15pt] &=\exp\left(-\dfrac{n}{2\sigma^2}(\bar{X}_n-\mu)^2\right) \end{aligned}

이 되고, 기각영역은 exp(n2σ2(Xˉnμ)2)λ\exp\left(-\dfrac{n}{2\sigma^2}(\bar{X}_n-\mu)^2\right)\le\lambda^*가 된다. 여기에서 λ\lambda^*

α=P[exp(n2σ2(Xˉnμ)2)λH0]\alpha=P\left[\left.\exp\left(-\dfrac{n}{2\sigma^2}(\bar{X}_n-\mu)^2\right)\le\lambda^*\right|H_0\right]

를 만족한다. 이 기각영역은 Xˉnμc|\bar{X}_n-\mu|\ge c와 동등하고 귀무가설하에서 XˉnN(μ0,σ2/n)\bar{X}_n\sim N(\mu_0,\sigma^2/n)을 따르므로

α=P[XˉnμcH0]\alpha=P[|\bar{X}_n-\mu|\ge c|H_0]

로부터 c=zα/2σnc=z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}임을 알 수 있다. 즉, 유의수준 α\alpha인 일반화 가능도비 검정법의 기각영역은

{(x1,,xn):xˉnμ+zα/2σnorxˉnμ+zα/2σn}\{(x_1,\ldots,x_n):\bar{x}_n\ge\mu+z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}\quad \text{or}\quad \bar{x}_n\le\mu+z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}\}

0개의 댓글