지수분포

choyunjeong·2024년 12월 25일

포아송 확률과정을 고려했을 때, 특정한 사건 AA가 일어나고 다음에 또 다시 같은 사건이 일어날 때까지 걸리는 시간의 값을 가지는 확률변수 XX.

XEXP(λ)X\sim \text{EXP}(\lambda)

1. 확률밀도함수와 확률분포함수

XEXP(λ)X\sim \text{EXP}(\lambda)일 때 확률밀도함수와 확률분포함수는 다음과 같다.

1) 확률밀도함수

f(x)=1λexp(x/λ)(x>0)f(x)=\dfrac{1}{\lambda}\exp(-x/\lambda)\quad (x>0)

\\[20pt]

2) 확률분포함수

F(x)=0x1λexp(t/λ)dt=1exp(x/λ)\begin{aligned} F(x) &=\int_{0}^{x}\dfrac{1}{\lambda}\exp(-t/\lambda)dt \\[10pt] &=1-\exp(-x/\lambda) \end{aligned}

\\[30pt]

2. 기댓값과 분산

XEXP(λ)X\sim \text{EXP}(\lambda)일 때 기댓값과 분산은 다음과 같다.

1) 기댓값

E(X)=0xf(x)dx=0x1λexp(x/λ) dx=xexp(xλ)0+0exp(xλ) dx=λexp(xλ)0=λ\begin{aligned} E(X) &=\int_{0}^{\infty}xf(x)dx \\[15pt] &=\int_{0}^{\infty}x\dfrac{1}{\lambda}\exp(-x/\lambda)\ dx \\[15pt] &=\left.-x\exp\left(-\dfrac{x}{\lambda}\right)\right|_{0}^{\infty}+\int_{0}^{\infty}\exp\left(-\dfrac{x}{\lambda}\right)\ dx \\[15pt] &=\left.\lambda\exp\left(-\dfrac{x}{\lambda}\right)\right|_{0}^{\infty} \\[10pt] &=\lambda \end{aligned}

\\[20pt]

2) 분산

E(X2)=0x2f(x)dx=0x21λexp(x/λ) dx=x2exp(xλ)0+20xexp(xλ) dx=0+2λ0x1λexp(xλ) dx=2λE(X)=2λ2Var(X)=2λ2λ2=λ2\begin{aligned} E(X^2) &=\int_{0}^{\infty}x^2f(x)dx \\[15pt] &=\int_{0}^{\infty}x^2\dfrac{1}{\lambda}\exp(-x/\lambda)\ dx \\[15pt] &=\left.-x^2\exp\left(-\dfrac{x}{\lambda}\right)\right|_{0}^{\infty} + 2\int_{0}^{\infty}x\exp\left(-\dfrac{x}{\lambda}\right)\ dx \\[15pt] &= 0+ 2\lambda\int_{0}^{\infty}x\dfrac{1}{\lambda}\exp\left(-\dfrac{x}{\lambda}\right)\ dx \\[15pt] &=2\lambda E(X) \\[10pt] &= 2\lambda^2 \\[20pt] \therefore \text{Var}(X) &=2\lambda^2-\lambda^2=\lambda^2 \end{aligned}

\\[20pt]


10초당 평균 5개씩 포아송 과정을 따라 발생한다고 가정. 첫 번째 입자가 발생될 때까지 걸리는 시간 XX가 5초 이상일 확률. 초당 발생할 기댓값 θ=1/2\theta = 1/2. 즉, λ=2\lambda=2

fX(x)=(1/2)ex/2f_X(x)=(1/2)e^{-x/2}

따라서

P(X5)=5(1/2)ex/2dxP(X\geq5)=\int_{5}^{\infty}(1/2)e^{-x/2}dx \\

\\[30pt]

3. 적률생성함수

XEXP(λ)X\sim \text{EXP}(\lambda)일 때 적률생성함수는 다음과 같다.

MX(t)=E(etX)=0etx1λexp{(x/λ)}dx=01λexp{(t1/λ)x}dx=1λλλt1[exp{(t1/λ)x}]0=1λt1[limxexp{(t1/λ)x}1]=11λt,t<1λ\begin{aligned} M_X(t) &=E(e^{tX}) \\[10pt] &=\int_{0}^{\infty}e^{tx}\cdot\dfrac{1}{\lambda}\exp\{(-x/\lambda)\} dx\\[15pt] &=\int_{0}^{\infty}\dfrac{1}{\lambda}\exp\{(t-1/\lambda)x\} dx\\[15pt] &=\dfrac{1}{\lambda}\left|\dfrac{\lambda}{\lambda t-1}\left[\exp\{(t-1/\lambda)x\}\right]\right|_{0}^{\infty}\\[15pt] &=\dfrac{1}{\lambda t-1}[\lim_{x\rightarrow \infty}\exp\{(t-1/\lambda)x\}-1]\\[10pt] &=\dfrac{1}{1-\lambda t},\quad t<\dfrac{1}{\lambda} \end{aligned}

따라서 적률생성함수를 활용한 기댓값과 분산은

  • 기댓값
    MX(1)(t)=(ddt)(11λt)=(1λt)(1λt)2=λ(1λt)2E(X)=MX(1)(0)=λ\begin{aligned} M^{(1)}_X(t) &=\left(\dfrac{d}{dt}\right)\left(\dfrac{1}{1-\lambda t}\right)=\dfrac{-(1-\lambda t)'}{(1-\lambda t)^2}=\dfrac{\lambda}{(1-\lambda t)^2}\\[30pt] \therefore E(X) &=M^{(1)}_X(0)=\lambda \end{aligned}

\\[20pt]

  • 분산
MX(2)(t)=(ddt)(λ(1λt)2)=λ(d/dt)(1λt)2(1λt)4=2λ2(1λt)3MX(2)(0)=2λ2Var(X)=MX(2)(0){MX(1)(0)}2=λ2\begin{aligned} M^{(2)}_X(t) &=\left(\dfrac{d}{dt}\right)\left(\dfrac{\lambda}{(1-\lambda t)^2}\right)=\lambda\cdot\dfrac{-(d/dt)(1-\lambda t)^2}{(1-\lambda t)^4}=\dfrac{2\lambda^2}{(1-\lambda t)^3} \\[20pt] M^{(2)}_X(0)&=2\lambda^2 \\[20pt] \therefore \text{Var}(X)&=M^{(2)}_X(0)-\left\{M^{(1)}_X(0)\right\}^2=\lambda^2 \end{aligned}

\\[20pt]

X1,X2,,XnX_1,X_2,\ldots,X_n이 서로 독립이고 확률변수 Xi, (i=1,2,,n)X_i,\ (i=1,2,\ldots,n)는 모두 평균이 λ\lambda인 지수분포의 합은 감마분포를 따른다.

MXi(t)=11λt,t<1λM_{X_i}(t)=\dfrac{1}{1-\lambda t},\quad t<\dfrac{1}{\lambda}

이므로 Y=X1+X2++XnY=X_1+X_2+\cdots+X_n이라고 하면

MY(t)=E[exp(tY)]=E[exp(t(X1,X2,,Xn))]=E[exp(tX1)]E[exp(tX2)]E[exp(tXn)]=i=1nMXi(t)=(11λt)n,t<1λ\begin{aligned} M_Y(t)&= E[\exp(tY)]\\[10pt] &= E[\exp(t(X_1,X_2,\ldots,X_n))]\\[10pt] &= E[\exp(tX_1)]\cdot E[\exp(tX_2)]\ldots\cdot E[\exp(tX_n)] \\[5pt] &=\prod_{i=1}^n M_{X_i}(t) \\[10pt] &=\left(\dfrac{1}{1-\lambda t}\right)^n,\quad t<\dfrac{1}{\lambda} \end{aligned}

이며 이는 GAM(n, λ)\text{GAM}(n,\ \lambda) 확률변수의 적률생성함수이다. 그러므로 YGAM(n, λ)Y\sim \text{GAM}(n,\ \lambda)이다.

\\[30pt]

4. 표본분포의 근사

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 표본평균과 표본분산은 다음과 같다.

표본평균

E(Xˉn)=E(1ni=1nXi)=1ni=1nE(Xi)=1nnE(X)=λ\begin{aligned} E(\bar{X}_n)&=E(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n}\cdot \sum_{i=1}^{n}E(X_i) \\[15pt] &=\dfrac{1}{n}\cdot n\cdot E(X) \\[10pt] &=\lambda \end{aligned}

\\[20pt]

Var(Xˉn)=Var(1ni=1nXi)=1n2Var(i=1nXi)=1n2i=1nVar(Xi)=1n2nVar(X)=σ2n\begin{aligned} \text{Var}(\bar{X}_n) &=\text{Var}(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n^2}\text{Var}(\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n^2}\sum_{i=1}^{n}\text{Var}(X_i) \\[15pt] &=\dfrac{1}{n^2}\cdot n\cdot \text{Var}(X) \\[15pt] &=\dfrac{\sigma^2}{n} \end{aligned}

\\[20pt]

표본분산

E(Sn2)=E[1n1i=1n(XiXˉn)2]=E[1n1i=1n(Xiλ+λXˉn)2]=E[1n1i=1n[(Xiλ)2+(λXˉn)2+2(Xiλ)(λXˉn)]]=1n1E[i=1n(Xiλ)2n(Xˉnλ)2]=1n1[i=1nE(Xiλ)2nE(Xˉnλ)2]=1n1[nVar(X)nVar(Xˉ)]=1n1[nλ2nλ2n]=λ2\begin{aligned} E(S_n^2) &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X}_n)^2\right] \\[15pt] &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\lambda+\lambda-\bar{X}_n)^2\right] \\[15pt] &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}[(X_i-\lambda)^2+(\lambda-\bar{X}_n)^2+2(X_i-\lambda)(\lambda-\bar{X}_n)]\right] \\[15pt] &=\dfrac{1}{n-1}E\left[\sum_{i=1}^{n}(X_i-\lambda)^2-n(\bar{X}_n-\lambda)^2\right] \\[15pt] &=\dfrac{1}{n-1}\left[\sum_{i=1}^{n}E(X_i-\lambda)^2-nE(\bar{X}_n-\lambda)^2\right] \\[15pt] &=\dfrac{1}{n-1}\left[n\text{Var}(X)-n\text{Var}(\bar{X})\right] \\[15pt] &=\dfrac{1}{n-1}\left[n\lambda^2-n\dfrac{\lambda^2}{n}\right] \\[15pt] &=\lambda^2 \end{aligned}

\\[20pt]

1) 대수의 법칙

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 표본평균은 모평균에 확률적으로 수렴한다.

Xˉnpλ\bar{X}_n \xrightarrow{p}\lambda

\\[20pt]

P[Xnˉλ<ϵ]=P[Xnˉλ2<ϵ2]1E(Xnˉλ)2ϵ2=1λ2/nϵ21\begin{aligned} \because \quad P[|\bar{X_n}-\lambda|<\epsilon] &=P[|\bar{X_n}-\lambda|^2<\epsilon^2] \\[10pt] &\ge 1-\dfrac{E(\bar{X_n}-\lambda)^2}{\epsilon^2} \\[10pt] &= 1-\dfrac{\lambda^2/n}{\epsilon^2}\rightarrow1 \end{aligned}

\\[20pt]

2) 중심극한정리

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 nn이 증가함에 따라 확률변량 ZnZ_n은 (표준)정규분포로 분포수렴한다.

Zn=n(Xˉnλ)dN(0, λ2)Zn=(Xˉnλ)λ2/ndN(0, 1)Zn=i=1n(Xiμ)nλ2dN(0, 1)\begin{aligned} Z_n&=\sqrt{n}(\bar{X}_n-\lambda)\xrightarrow{d}N(0,\ \lambda^2) \\[20pt] Z_n&=\dfrac{(\bar{X}_n-\lambda)}{\sqrt{\lambda^2/n}}\xrightarrow{d}N(0,\ 1) \\[20pt] Z_n&=\dfrac{\sum_{i=1}^{n}(X_i-\mu)}{\sqrt{n\lambda^2}}\xrightarrow{d}N(0,\ 1) \end{aligned}

\\[20pt]

3) 델타방법

확률변수 열 X1,X2,,Xn,X_1,X_2,\ldots,X_n,\ldots이 중심극한정리를 만족한다면

n(Xnλ)dN(0,λ2)\sqrt{n}(X_n-\lambda)\xrightarrow{d}N(0,\lambda^2)

이때 함수 g(λ)g(\lambda)의 연속인 도함수 g(λ)g'(\lambda)가 존재하고 0이 아니면

n(g(Xn)g(λ))dN(0,σ2[g(λ)]2)\sqrt{n}(g(X_n)-g(\lambda))\xrightarrow{d}N(0,\sigma^2[g'(\lambda)]^2)

이 성립하며 이를 델타 방법이라한다. 이제 함수 g(x)=x2g(x)=x^2를 고려하면 g(λ)=λ2g(\lambda)=\lambda^2, σ2=λ2\sigma^2=\lambda^2, g(λ)=2λg'(\lambda)=2\lambda이므로

n(Xˉn2λ2)dN(0,4λ4)\sqrt{n}(\bar{X}_n^2-\lambda^2)\xrightarrow{d}N(0,4\lambda^4)

\\[30pt]

5. 추정량

1) 적률 추정량

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 λ\lambda의 추정값을 적률을 사용하는 방법으로 추정.

m1=μ1(λ)=λi=1nXi1/n=λ^λ^=Xˉn\begin{aligned} m_1'&=\mu_1'(\lambda)=\lambda \\[10pt] \rightarrow \sum_{i=1}^{n}X_i^1/n &= \hat{\lambda} \\[15pt] \therefore \hat{\lambda} &= \bar{X}_n \end{aligned}

\\[20pt]

2) 최대가능도 추정량

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 λ\lambda의 최대가능도 추정량은 로그 가능도함수의 미분을 이용하여 다음과 같이 구한다.

λ\lambda의 최대가능도추정량을 구하기 위한 지수분포의 가능도함수는

L(λ;x1,x2,,xn)=i=1nf(xi;λ)=(1λ)nexp(i=1nxi/λ)\begin{aligned} L(\lambda;x_1,x_2,\ldots,x_n) &=\prod_{i=1}^{n}f(x_i;\lambda)\\[15pt] &=\left(\dfrac{1}{\lambda}\right)^n\exp(\sum_{i=1}^{n}-x_i/\lambda) \end{aligned}

가 되며, 따라서 로그가능도함수는

logL(λ;x1,x2,,xn)=nlogλi=1nxi/λ\text{log}L(\lambda;x_1,x_2,\ldots,x_n)=-n\text{log}\lambda -\sum_{i=1}^{n}-x_i/\lambda

가 된다. 이제 로그가능도 함수를 최대화하는 값을 찾기 위해 다음 방적식의 해를 찾는다.

ddλlogL(λ;x1,x2,,xn)=nλ+i=1nxiλ2=0=i=1nxi=nλ=λ^=xˉn\begin{aligned} \dfrac{d}{d\lambda}\text{log}L(\lambda;x_1,x_2,\ldots,x_n) &=-\dfrac{n}{\lambda}+\sum_{i=1}^{n}\dfrac{x_i}{\lambda^2}=0 \\[15pt] &=\sum_{i=1}^{n}x_i=n\lambda \\[15pt] &=\hat{\lambda}=\bar{x}_n \end{aligned}

이 방정식이 방정식을 만족하는 λ^=xˉn\hat{\lambda}=\bar{x}_n

d2dλ2logL(λ;x1,x2,,xn)λ=xˉn=nλ2λ=xˉn2i=1nxiλ3λ=xˉn=nxˉn22nxˉn31ni=1nxi=nxˉn22nxˉn2=nxˉn2<0\begin{aligned} \left.\dfrac{d^2}{d\lambda^2}\text{log}L(\lambda;x_1,x_2,\ldots,x_n)\right|_{\lambda=\bar{x}_n} &=\left.\dfrac{n}{\lambda^2}\right|_{\lambda=\bar{x}_n}-2\sum_{i=1}^{n}\left.\dfrac{x_i}{\lambda^3}\right|_{\lambda=\bar{x}_n} \\[15pt] &=\dfrac{n}{\bar{x}_n^2}-\dfrac{2n}{\bar{x}_n^3}\cdot\dfrac{1}{n}\sum_{i=1}^{n}x_i \\[15pt] &=\dfrac{n}{\bar{x}_n^2}-\dfrac{2n}{\bar{x}_n^2} \\[15pt] &=-\dfrac{n}{\bar{x}_n^2}<0 \end{aligned}

을 만족시키므로(모든 xˉn\bar{x}_n 가능) 가능도함수를 최대화하는 최대가능도 추정량은 Xˉn\bar{X}_n이다. λ^\hat{\lambda}의 기댓값은 다음과 같다.

\\[20pt]

최대가능도 추정량의 불변성

λ^\hat{\lambda}가 모수 λ\lambda의 최대가능도 추정량이면, λ\lambda의 함수인 g(λ)g(\lambda)에 대하여, g(λ^)g(\hat{\lambda})g(λ)g(\lambda)의 최대가능도 추정량이 된다. 따라서 g(λ)=λ2g(\lambda)=\lambda^2의 추정량이 필요할 때 다음과 같이 쉽게 구할 수 있다.

g(λ^)=λ2^=Xˉn2g(\hat{\lambda})=\hat{\lambda^2}=\bar{X}_n^2

\\[30pt]

6. 좋은 추정량 조건

최대가능도 추정량인 경우만 고려하였다.

1) 비편향추정량

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 최대가능도 추정량의 기댓값이 모평균과 같다면 비편향추정량이다. 이 때 최대가능도 추정량의 기댓값 E[Xˉn]E[\bar{X}_n]λ\lambda이므로

E[Xˉn]λ=0E[\bar{X}_n]-\lambda=0

비편향추정량을 만족한다.

\\[20pt]

2) 최소분산 비편향추정량

2-1. 크래머-라오 방법

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 비편향 추정량인 최대 가능도 추정량의 분산에 대한 부등식은 다음이 성립한다.

Var(Xˉn)[g(λ)]2nI(λ)\text{Var}(\bar{X}_n)\ge\dfrac{[g'(\lambda)]^2}{nI(\lambda)}

T(X)T(X)g(θ)g(\theta)형태가 아닌 θ\theta의 비편향추정량이라고 한다면 위 정리로부터

Var(Xˉn)1nI(λ)\text{Var}(\bar{X}_n)\ge\dfrac{1}{nI(\lambda)}

을 얻을 수 있다. 그러므로 어떤 비편향추정량 Xˉn\bar{X}_n의 분산이 1nI(λ)\dfrac{1}{nI(\lambda)}이라면 이 추정량은 θ\theta의 최소분산 비편향추정량이다.
\\[10pt]

이 때 피셔의 정보량 I(θ)I(\theta)은 다음과 같고

I(θ)=E[(θlog f(X;θ))2]=E[(2θ2log f(X;θ))]I(\theta)=E\left[\left(\dfrac{\partial}{\partial\theta}\text{log }f(X;\theta)\right)^2\right]=-E\left[\left(\dfrac{\partial^2}{\partial\theta^2}\text{log }f(X;\theta)\right)\right]

계산을 하면

I(λ)=E[(λlog f(X;λ))2]=E[(λ{log λXλ})2]=E[1λ+Xλ2]2=E[1λ22Xλ3+X2λ4]=1λ22λ2+2λ2(E(X)=λ, E(X2)=2λ2)=1λ2\begin{aligned} I(\lambda) &=E\left[\left(\dfrac{\partial}{\partial \lambda}\text{log }f(X;\lambda)\right)^2\right] \\[15pt] &=E\left[\left(\dfrac{\partial}{\partial \lambda}\left\{-\text{log } \lambda - \dfrac{X}{\lambda}\right\}\right)^2\right] \\[15pt] &=E\left[-\frac{1}{\lambda} + \dfrac{X}{\lambda^2}\right]^2 \\[15pt] &=E\left[\dfrac{1}{\lambda^2} - \dfrac{2X}{\lambda^3} + \dfrac{X^2}{\lambda^4}\right] \\[15pt] &=\dfrac{1}{\lambda^2} -\dfrac{2}{\lambda^2} + \dfrac{2}{\lambda^2}\quad (\because E(X)=\lambda,\ E(X^2)=2\lambda^2) \\[10pt] &=\dfrac{1}{\lambda^2} \end{aligned}

따라서 Var(Xˉn)=1nI(μ)=λ2/n\text{Var}(\bar{X}_n)=\dfrac{1}{nI(\mu)}=\lambda^2/n이므로 표본평균 Xˉn\bar{X}_n는 최소분산 비편향추정량이다.

\\[20pt]

3) 일치추정량

추정량이 일치성을 가질 조건을 평균제곱오차(MSE)를 이용하여 표현할 경우, Tn(X)T_n(X)g(θ)g(\theta)의 추정량이라고 할 때, 모든 θΩ\theta\in\Omega에 대하여

limnE[Tn(X)g(θ)]2=0\lim_{n\rightarrow\infty}E[T_n(X)-g(\theta)]^2=0

이 성립하면, Tn(X)T_n(X)는 일치성이 있다. 이 때

MSE(Tn)=E[Tn(X)g(θ)]2=Var(Tn)+[E(Tn)g(θ)]2\text{MSE}(T_n)=E[T_n(X)-g(\theta)]^2=\text{Var}(T_n)+[E(T_n)-g(\theta)]^2

이므로 TnT_ng(θ)g(\theta)의 비편향추정량인 경우 [E(Tn)g(θ)]=0[E(T_n)-g(\theta)]=0이므로 limnVar(Tn)=0\lim_{n\rightarrow\infty}\text{Var}(T_n)=0이 성립하면 추정량 TnT_n의 일치성이 보장된다. (정리 4.9참조)

\\[20pt]

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 최대가능도 추정량 Xˉn\bar{X}_n은 비편향추정량이므로 [E(Tn)g(θ)]=0[E(T_n)-g(\theta)]=0이다. 또한 nn이 증가할 때 Var(Xˉn)\text{Var}(\bar{X}_n)

limnVar(Xˉn)=limnλ2n=0\lim_{n\rightarrow\infty}\text{Var}(\bar{X}_n)=\lim_{n\rightarrow\infty}\dfrac{\lambda^2}{n}=0

으로

limnMSE(Xˉn)=limnVar(Xˉn)+[E(Tn)g(θ)]=0+0=0\begin{aligned} \lim_{n\rightarrow\infty}\text{MSE}(\bar{X}_n) &= \lim_{n\rightarrow\infty}\text{Var}(\bar{X}_n)+ [E(T_n)-g(\theta)] \\[10pt] &= 0+0 \\[10pt] &= 0 \end{aligned}

이므로 Xˉn\bar{X}_n는 일치추정량이다. 이를 보아 대부분 분포의 최대추정량의 분산의 분모는 nn이므로 대부분 일치추정량이라고 할 수 있다.

한편 nX(1)EXP(λ)nX_{(1)}\sim \text{EXP}(\lambda)이므로 nX(1)nX_{(1)}λ\lambda의 비편향추정량이다. 하지만 ϵ<λ\epsilon<\lambdaϵ>0\epsilon>0에 대해

P[nX(1)λϵ]=e1(eϵ/λeϵ/λ)P[|nX_{(1)}-\lambda|\le\epsilon]=e^{-1}(e^{\epsilon/\lambda}-e^{-\epsilon/\lambda})

nn이 커질 때 1로 수렴하지 않으므로 일치추정량이 아니다.

\\[20pt]

직접적으로 일치성을 입증하기 어려운 경우 적절한 조건하에서 점근적 성질을 이용한다면 최대가능도 추정량은 일치성을 가질 뿐 아니라 점근적으로 정규분포를 따르기 때문에 쉽게 근사적 구간추정과 검정이 가능하다.

n(λ^nλ)dN(0, 1I(λ))\sqrt{n}(\hat{\lambda}_n-\lambda)\xrightarrow{d}N\left(0,\ \dfrac{1}{I(\lambda)}\right)

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 최대가능도 추정량은 λ^n=Xˉn\hat{\lambda}_n=\bar{X}_n으로 적절한 조건하에서 일치추정량이고, 나아가 점근적으로 정규분포를 따르는지 확인해보자.

이 때 I(λ)I(\lambda)

I(λ)=E[(2λ2log f(X;λ))]I(\lambda)=-E\left[\left(\dfrac{\partial^2}{\partial\lambda^2}\text{log }f(X;\lambda)\right)\right]

으로 logf(X;λ)\log f(X;\lambda)의 2차 도함수를 먼저 구하면

f(X;λ)=1λexp(X/λ)logf(X;λ)=logλX/λ(λ)log f(X;λ)=1λ+Xλ2(2λ2)log f(X;λ)=1λ22Xλ3\begin{aligned} f(X;\lambda) &= \dfrac{1}{\lambda}\exp(-X/\lambda) \\[15pt] \log f(X;\lambda) & =-\log \lambda -X/\lambda \\[15pt] \left(\dfrac{\partial}{\partial\lambda}\right)\text{log }f(X;\lambda) &=-\dfrac{1}{\lambda}+\dfrac{X}{\lambda^2} \\[15pt] \left(\dfrac{\partial^2}{\partial\lambda^2}\right)\text{log }f(X;\lambda) &=\dfrac{1}{\lambda^2}-\dfrac{2X}{\lambda^3} \end{aligned}

이므로

I(λ)=E(1λ22Xλ3)=2λ3E(X)1λ2=2λ3λ1λ2=1λ2\begin{aligned} I(\lambda) &=-E\left(\dfrac{1}{\lambda^2}-\dfrac{2X}{\lambda^3}\right) \\[15pt] &=\dfrac{2}{\lambda^3}E(X)-\dfrac{1}{\lambda^2} \\[15pt] &=\dfrac{2}{\lambda^3}\cdot \lambda-\dfrac{1}{\lambda^2} \\[15pt] &=\dfrac{1}{\lambda^2} \end{aligned}

따라서 최대가능도 추정량 λ^\hat{\lambda}의 점근분포는

n(λ^λ)dN(0, λ2)\sqrt{n}(\hat{\lambda}-\lambda)\xrightarrow{d}N\left(0,\ \lambda^2\right)

가 되고, 이것은 중심극한정리에서 얻은 결과와 동일하다.

\\[30pt]

7. 구간추정

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 다음과 같이 신뢰구간을 중심극한정리를 이용하여 다음과 같이 근사적으로 구할 수 있다.

모분산을 아는경우

표본의 크기가 커질 때 대수의 법칙에 따라 표본평균 Xˉnpλ\bar{X}_n\xrightarrow{p}\lambda에 확률적으로 수렴하고 중심극한정리에 따라

n(Xˉnλ)λ2dN(0,1)\dfrac{\sqrt{n}(\bar{X}_n-\lambda)}{\sqrt{\lambda^2}}\xrightarrow{d} N(0,1)

이므로 슬럿츠키 정리에 의해

Zn=n(Xˉnλ)Xˉn2dN(0,1)Z_n=\dfrac{\sqrt{n}(\bar{X}_n-\lambda)}{\sqrt{\bar{X}_n^2}}\xrightarrow{d} N(0,1)

로 수렴한다. 따라서 모수 λ\lambda에 대한 95%의 근사신뢰구간을 다음과 같이 구할 수 있다.

[Xˉn1.96Xˉn2n,Xˉn+1.96Xˉn2n]\left[\bar{X}_n-1.96\sqrt{\dfrac{\bar{X}_n^2}{n}} , \bar{X}_n+1.96\sqrt{\dfrac{\bar{X}_n^2}{n}}\right] \\[15pt]

\\[20pt]

모분산을 알지 못하는 경우
σ2\sigma^2Sn2S_n^2으로 대체한다.

\\[30pt]

8. 가설검정

1) 최강력 검정법 (네이만-피어슨 방법)

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n이라 하고 다음 가설 검정을 한다.

H0:λ=λ0vsH0:λ=λ1 (>λ0)H_0:\lambda=\lambda_0\quad \text{vs}\quad H_0:\lambda=\lambda_1\ (>\lambda_0)

에 대한 가능도비는 다음과 같이 주어진다.

LR(λ0,λ1;x1,x2,,xn)=λ0nexp(i=1nxi/λ0)λ1nexp(i=1nxi/λ1)=(λ1λ0)nexp[(1λ11λ0)i=1nxi]\begin{aligned} LR(\lambda_0,\lambda_1;x_1,x_2,\ldots,x_n) &=\dfrac{\lambda_0^{-n}\exp(-\sum_{i=1}^{n}x_i/\lambda_0)} {\lambda_1^{-n}\exp(-\sum_{i=1}^{n}x_i/\lambda_1)} \\[15pt] &=\left(\dfrac{\lambda_1}{\lambda_0}\right)^n \exp\left[\left(\dfrac{1}{\lambda_1}-\dfrac{1}{\lambda_0}\right)\sum_{i=1}^{n}x_i\right] \end{aligned}

그런데 λ1>λ0\lambda_1>\lambda_0으로부터 1λ11λ0<0\dfrac{1}{\lambda_1}-\dfrac{1}{\lambda_0}<0이며 따라서 LR(λ0,λ1;x1,x2,,xn)kLR(\lambda_0,\lambda_1;x_1,x_2,\ldots,x_n)\le k가 성립하는 것은 i=1nxik1\sum_{i=1}^{n}x_i\ge k_1이 성립함과 동일하다. 이제 네이만-피어슨 정리에 의해 최강렵 검정법의 기각영역은

C={(x1,x2,,xn):i=1nxik1}C=\{(x_1,x_2,\ldots,x_n):\sum_{i=1}^{n}x_i\ge k_1\}

의 꼴로 주어진다. 그런데 귀무가설 하에, 즉 λ=λ0\lambda=\lambda_0일 때,

i=1n2xiλ0χ2(2n)\sum_{i=1}^{n}\dfrac{2x_i}{\lambda_0}\sim \chi^2(2n)

을 따른다. 그러므로 가설에 대한 유의수준 α\alpha인 기각영역은

P[i=1nXik1λ=λ0]=αP\left[\sum_{i=1}^{n}X_i\ge k_1|\lambda=\lambda_0\right]=\alpha

로부터

C={(x1,x2,,xn):i=1nxi(λ0/2)χ2(2n)}C=\{(x_1,x_2,\ldots,x_n):\sum_{i=1}^{n}x_i\ge (\lambda_0/2)\chi^2(2n)\}

으로 주어진다.

\\[20pt]

2) 균일 최강력 검정법

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n이라 하고 다음 가설 검정을 한다.

H0:λλ0vsH0:λ>λ0H_0:\lambda\le \lambda_0\quad\text{vs}\quad H_0:\lambda > \lambda_0

(1/λ11/λ0)<0(1/\lambda_1-1/\lambda_0)<0이므로 가능도비 LR(λ0,λ1;x1,x2,,xn)LR(\lambda_0,\lambda_1;x_1,x_2,\ldots,x_n)T(x1,x2,,xn)=i=1nxiT(x_1,x_2,\ldots,x_n)=\sum_{i=1}^{n}x_i에 대해 비증가함수이며 따라서 이 경우 가능도함수는 T(X1,X2,,Xn)=i=1nxiT(X_1,X_2,\ldots,X_n)=\sum_{i=1}^{n}x_i에 대해 비증가하는 단조가능도비의 성질이 있으므로 유의수준 α=P(i=1nxikλ0)\alpha=P(\sum_{i=1}^{n}x_i\ge k|\lambda_0)인 균일최강력 검정법은 그 기각영역이

C={(x1,x2,,xn):i=1nxik}C=\{(x_1,x_2,\ldots,x_n):\sum_{i=1}^{n}x_i\ge k\}

로 주어지며, 상수 kkα=P(i=1nxikλ0)\alpha=P(\sum_{i=1}^{n}x_i\ge k|\lambda_0)에 의해 결정된다 (구체적 값은 위 네이만-피어슨 방법과 동일하다).

\\[20pt]

3) 일반화 가능도비 검정법

일반화 가능도비를 적절히 변환시킴으로써 필요한 검정통계량의 분포를 구하기 어려움이 존재해 근사 가능도비 검정법을 이용하여 일반화 가능도비 통계량의 근사분포를 구할 수 있다.

\\[20pt]

4) 근사 가능도비 검정법

XEXP(λ)X\sim \text{EXP}(\lambda)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n이라 하고 다음 가설 검정을 한다.

H0:λ=λ0vsH1:λλ0H_0:\lambda=\lambda_0\quad\text{vs}\quad H_1:\lambda\neq \lambda_0

점근적 정규성 (정리4.13) 조건을 만족할 때, 2logΛ-2\text{log}\Lambda는 귀무가설 하에 자유도가 kk인 카이제곱분포를 근사적으로 따른다. 2logΛ-2\text{log}\LambdaΛ\Lambda의 감소함수이므로 Λ\Lambda의값이 충분히 작을 때 귀무가설을 기각하는 것은 2logΛ-2\text{log}\Lambda가 충분히 클 때 귀무가설을 기각하는 것과 동일.

2logΛχα(k)-2\text{log}\Lambda \ge \chi_{\alpha}(k)

따라서 유의수준 α\alpha인 근사 기각영역은 {(x1,x2,,xn):2logΛχα(1)}\left\{(x_1,x_2,\ldots,x_n):-2\text{log}\Lambda\ge \chi_{\alpha}(1)\right\}이다.

최대가능도 추정량이 Xˉn\bar{X}_n이므로 일반화 가능도비는

Λ(X1,X2,Xn)=λ0nexp(i=1nXi/λ0)Xˉnnexp(i=1nXi/Xˉn)=(Xˉnλ0)nexp[(1Xˉn1λ0)i=1nXi]\begin{aligned} \Lambda (X_1,X_2\ldots,X_n) &=\dfrac{\lambda_0^{-n}\exp\left(-\sum_{i=1}^{n}X_i/\lambda_0\right)}{\bar{X}_n^{-n}\exp\left(-\sum_{i=1}^{n}X_i/\bar{X}_n\right)} \\[15pt] &= \left(\dfrac{\bar{X}_n}{\lambda_0}\right)^n\exp\left[\left(\dfrac{1}{\bar{X}_n}-\dfrac{1}{\lambda_0}\right)\sum_{i=1}^{n}X_i\right] \end{aligned}

따라서 귀무가설 하에

2logΛ=2{nlog(Xˉnλ0)+(1Xˉn1λ0)nXˉn}\begin{aligned} -2\text{log}\Lambda &=-2\left\{n \log\left(\dfrac{\bar{X}_n}{\lambda_0}\right) + \left(\dfrac{1}{\bar{X}_n}-\dfrac{1}{\lambda_0}\right)n\bar{X}_n\right\} \\[15pt] \end{aligned}

이다. 테일러 정리로부터 x0|x|\approx 0인 경우 log(1+x)=xx2/2\log(1+x)=x-x^2/2라는 근사관계로부터

log(Xˉnλ0)=log(1+Xˉnλ0λ0)Xˉnλ0λ012(Xˉnλ0λ0)2\log\left(\dfrac{\bar{X}_n}{\lambda_0}\right) = \log\left(1+\dfrac{\bar{X}_n-\lambda_0}{\lambda_0}\right) \approx\dfrac{\bar{X}_n-\lambda_0}{\lambda_0}-\dfrac{1}{2}\left(\dfrac{\bar{X}_n-\lambda_0}{\lambda_0}\right)^2

로 이를 대입하면

2logΛ=2{nlog(Xˉnλ0)+(1Xˉn1λ0)nXˉn}=2[n{Xˉnλ0λ012(Xˉnλ0λ0)2}n(Xˉnλ0λ0)]=n(Xˉnλ0)2λ02χα2(1)\begin{aligned} -2\log\Lambda &=-2\left\{n \log\left(\dfrac{\bar{X}_n}{\lambda_0}\right) + \left(\dfrac{1}{\bar{X}_n}-\dfrac{1}{\lambda_0}\right)n\cdot\bar{X}_n\right\} \\[15pt] &=-2\left[n \left\{\dfrac{\bar{X}_n-\lambda_0}{\lambda_0}-\dfrac{1}{2}\left(\dfrac{\bar{X}_n-\lambda_0}{\lambda_0}\right)^2\right\} - n\cdot\left(\dfrac{\bar{X}_n-\lambda_0}{\lambda_0}\right)\right] \\[15pt] &=\dfrac{n\left(\bar{X}_n-\lambda_0\right)^2}{\lambda_0^2} \\[15pt] &\approx \chi_\alpha^2(1) \end{aligned}

이므로 2logΛ-2\log\Lambdaχ2(α)\chi^2(\alpha)를 근사적으로 따른다는 것을 알 수 있다.

0개의 댓글