감마분포

choyunjeong·2024년 12월 25일

지수분포 등 여러가지 분포를 포함하는 분포족. 이 때 감마함수는

Γ(k)=0tk1etdt(k>0)\Gamma(k)=\int_{0}^{\infty}t^{k-1}e^{-t}dt\quad (k>0)

이와 같이 정의된 감마함수는

Γ(1)=0etdt=1\Gamma(1)=\int_{0}^{\infty}e^{-t}dt=1

감마함수의 성질

  1. Γ(k)=(k1)Γ(k1),(k>1)\Gamma(k)=(k-1)\Gamma(k-1),\quad (k>1)
  2. Γ(n)=(n1)!\Gamma(n)=(n-1)!
  3. Γ(12)=π\Gamma(\frac{1}{2})=\sqrt{\pi}

\\[30pt]

1. 확률밀도함수

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)일 때 확률밀도함수와 확률분포함수는 다음과 같다.

f(x;k, θ)=1θkΓ(k)xk1ex/θ(x>0)f(x; k,\ \theta)=\dfrac{1}{\theta^k\Gamma(k)}x^{k-1}e^{-x/\theta}\quad (x>0)

\\[30pt]

2. 기댓값과 분산

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)일 때 기댓값과 분산은 다음과 같다.

1) 기댓값

E(x)=0x1θkΓ(k)xk1ex/θdx=θ1+kΓ(1+k)θkΓ(k)01θ1+kΓ(1+k)x(1+k)1ex/θdx=θ1+kΓ(1+k)θkΓ(k)=kθ\begin{aligned} E(x) &=\int_{0}^{\infty}x\cdot\dfrac{1}{\theta^k\Gamma(k)}x^{k-1}e^{-x/\theta}dx \\[15pt] &=\dfrac{\theta^{1+k}\Gamma(1+k)}{\theta^k\Gamma(k)}\int_{0}^{\infty}\dfrac{1}{\theta^{1+k}\Gamma(1+k)}x^{(1+k)-1}e^{-x/\theta}dx \\[15pt] &=\dfrac{\theta^{1+k}\Gamma(1+k)}{\theta^k\Gamma(k)}\\[15pt] &=k\theta \end{aligned}

\\[20pt]

2) 분산

E(x2)=0x21θkΓ(k)xk1ex/θdx=θ2+kΓ(2+k)θkΓ(k)01θ2+kΓ(2+k)x(2+k)1ex/θdx=θ2+kΓ(2+k)θkΓ(k)=k(1+k)θ2Var(X)=k(1+k)θ2k2θ2=kθ2\begin{aligned} E(x^2) &=\int_{0}^{\infty}x^2\cdot\dfrac{1}{\theta^k\Gamma(k)}x^{k-1}e^{-x/\theta}dx \\[15pt] &=\dfrac{\theta^{2+k}\Gamma(2+k)}{\theta^k\Gamma(k)}\int_{0}^{\infty}\dfrac{1}{\theta^{2+k}\Gamma(2+k)}x^{(2+k)-1}e^{-x/\theta}dx \\[15pt] &=\dfrac{\theta^{2+k}\Gamma(2+k)}{\theta^k\Gamma(k)}\\[15pt] &=k(1+k)\theta^2 \\[20pt] \therefore \text{Var}(X) &=k(1+k)\theta^2-k^2\theta^2 \\[5pt] &=k\theta^2 \end{aligned}

위의 감마분포에서 모수 kk는 분포의 모양을 특정짓는 모수이며, k=1k=1인 경우는 모수가 θ\theta인 지수분포에 해당한다.

f(x;1, θ)=1θex/θ(x>0)f(x; 1,\ \theta)=\dfrac{1}{\theta}e^{-x/\theta}\quad (x>0)

\\[30pt]

3. 적률생성함수

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)일 때 적률생성함수는 다음과 같다.

MX(t)=E(etx)=0etx1θkΓ(k)xk1ex/θdx=1θkΓ(k)0xk1exp{(t1/θ)/x}dx=(1/θt)k1θkΓ(k)0uk1exp(u)du=(1θt)k,t<1θ\begin{aligned} M_X(t) &=E(e^{tx}) \\[10pt] &=\int_{0}^{\infty}e^{tx}\cdot\dfrac{1}{\theta^k\Gamma(k)}x^{k-1}e^{-x/\theta} dx\\[15pt] &=\dfrac{1}{\theta^k\Gamma(k)}\int_{0}^{\infty}x^{k-1}\exp\{(t-1/\theta)/x\} dx\\[15pt] &=(1/\theta-t)^{-k}\dfrac{1}{\theta^k\Gamma(k)}\int_{0}^{\infty}u^{k-1}\exp(-u) du \\[15pt] &=(1-\theta t)^{-k},\quad t<\dfrac{1}{\theta} \end{aligned}

따라서 적률생성함수로 활용한 기댓값과 분산은

  • 기댓값
    MX(1)(t)=(ddt)(1θt)k=k((1θt)k1(θ))E(X)=MX(1)(0)=kθ\begin{aligned} M^{(1)}_X(t) &=\left(\dfrac{d}{dt}\right)(1-\theta t)^{-k}=-k\left((1-\theta t)^{-k-1}\cdot (-\theta)\right) \\[30pt] \therefore E(X) &=M^{(1)}_X(0)=k\theta \end{aligned}

\\[20pt]

  • 분산
MX(2)(t)=(d/dt)(kθ(1θt)k+1)=kθ(d/dt)((1θt)(k+1))=kθ(k+1)(1θt)(k+2)(θ)=k(1+k)θ2(1θt)k+2MX(2)(0)=k(1+k)θ2Var(X)=k(1+k)θ2k2θ2=kθ2\begin{aligned} M^{(2)}_X(t) &=(d/dt)\left(\dfrac{k\theta}{(1-\theta t)^{k+1}}\right) \\[15pt] &= k\theta \cdot (d/dt) \left( (1-\theta t)^{-(k+1)} \right) \\[15pt] &= k\theta \cdot -(k+1)(1-\theta t)^{-(k+2)} \cdot (-\theta) \\[15pt] &= \dfrac{k(1+k)\theta^2}{(1-\theta t)^{k+2}} \\[15pt] M^{(2)}_X(0)&=k(1+k)\theta^2 \\[20pt] \therefore \text{Var}(X)&=k(1+k)\theta^2-k^2\theta^2=k\theta^2 \end{aligned}

\\[30pt]

4. 표본분포의 근사

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 표본평균과 표본분산은 다음과 같다.

표본평균

E(Xˉn)=E(1ni=1nXi)=1n{i=1nE(Xi)}=1nnE(X)=kθ\begin{aligned} E(\bar{X}_n)&=E(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n}\left\{\sum_{i=1}^{n}E(X_i)\right\} \\[15pt] &=\dfrac{1}{n}\cdot n\cdot E(X)=k\theta \end{aligned}

\\[20pt]

Var(Xˉn)=Var(1ni=1nXi)=1n2Var(i=1nXi)=1n2i=1nVar(Xi)=nkθ2n2=kθ2n\begin{aligned} \text{Var}(\bar{X}_n) &=\text{Var}(\dfrac{1}{n}\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n^2}\text{Var}(\sum_{i=1}^{n}X_i) \\[15pt] &=\dfrac{1}{n^2}\sum_{i=1}^{n}\text{Var}(X_i) \\[15pt] &=\dfrac{nk\theta^2}{n^2} \\[10pt] &=\dfrac{k\theta^2}{n} \end{aligned}

\\[20pt]

표본분산

E(Sn2)=E[1n1i=1n(XiXˉn)2]=E[1n1i=1n(Xikθ+kθXˉn)2]=E[1n1i=1n[(Xikθ)2+(kθXˉn)2+2(Xikθ)(kθXˉn)]]=1n1E[i=1n(Xikθ)2n(Xˉnkθ)2]=1n1[i=1nE(Xikθ)2nE(Xˉnkθ)2]=1n1[nkθ2nkθ2n]=kθ2\begin{aligned} E(S_n^2) &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X}_n)^2\right] \\[15pt] &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-k\theta+k\theta-\bar{X}_n)^2\right] \\[15pt] &=E\left[\dfrac{1}{n-1}\sum_{i=1}^{n}[(X_i-k\theta)^2+(k\theta-\bar{X}_n)^2+2(X_i-k\theta)(k\theta-\bar{X}_n)]\right] \\[15pt] &=\dfrac{1}{n-1}E\left[\sum_{i=1}^{n}(X_i-k\theta)^2-n(\bar{X}_n-k\theta)^2\right] \\[15pt] &=\dfrac{1}{n-1}\left[\sum_{i=1}^{n}E(X_i-k\theta)^2-nE(\bar{X}_n-k\theta)^2\right] \\[15pt] &=\dfrac{1}{n-1}\left[nk\theta^2-n\dfrac{k\theta^2}{n}\right] \\[15pt] &=k\theta^2 \end{aligned}

\\[20pt]

1) 대수의 법칙

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 표본평균은 모평균에 확률적으로 수렴한다.

Xˉnpkθ\bar{X}_n \xrightarrow{p}k\theta

\\[20pt]

P[Xnˉkθ<ϵ]=P[Xnˉkθ2<ϵ2]1E(Xnˉkθ)2ϵ2=1kθ2/nϵ21\begin{aligned} \because \quad P[|\bar{X_n}-k\theta|<\epsilon] &=P[|\bar{X_n}-k\theta|^2<\epsilon^2] \\[10pt] &\ge 1-\dfrac{E(\bar{X_n}-k\theta)^2}{\epsilon^2} \\[10pt] &= 1-\dfrac{k\theta^2/n}{\epsilon^2}\rightarrow1 \end{aligned}

\\[20pt]

2) 중심극한정리

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 nn이 증가함에 따라 (표준)정규분포로 분포수렴한다.

Zn=n(Xˉnkθ)dN(0, kθ2)Zn=(Xˉnkθ)kθ2/ndN(0, 1)Zn=i=1n(Xikθ)nkθ2dN(0, 1)\begin{aligned} Z_n&=\sqrt{n}(\bar{X}_n-k\theta)\xrightarrow{d}N(0,\ k\theta^2) \\[20pt] Z_n&=\dfrac{(\bar{X}_n-k\theta)}{\sqrt{k\theta^2/n}}\xrightarrow{d}N(0,\ 1) \\[20pt] Z_n&=\dfrac{\sum_{i=1}^{n}(X_i-k\theta)}{\sqrt{nk\theta^2}}\xrightarrow{d}N(0,\ 1) \end{aligned}

\\[20pt]

3) 델타방법

확률변수 열 X1,X2,,Xn,X_1,X_2,\ldots,X_n,\ldots이 중심극한정리를 만족한다면

n(Xnkθ)dN(0,kθ2)\sqrt{n}(X_n-k\theta)\xrightarrow{d}N(0,k\theta^2)

이때 함수 g(λ)g(\lambda)의 연속인 도함수 g(λ)g'(\lambda)가 존재하고 0이 아니면

n(g(Xn)g(kθ))dN(0,σ2[g(kθ)]2)\sqrt{n}(g(X_n)-g(k\theta))\xrightarrow{d}N(0,\sigma^2[g'(k\theta)]^2)

이 성립하며 이를 델타 방법이라한다.

\\[30pt]

5. 추정량

1) 적률 추정량

XGAM(k, θ)X\sim \text{GAM}(k,\ \theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 k, θk,\ \theta의 추정값을 적률을 사용하는 방법으로 추정.

1) k^\hat{k}추정

m1=μ1(k,θ)=kθi=1nXi1/n=k^θ^k^=Xˉnθ^\begin{aligned} m_1'&=\mu_1'(k,\theta)=k\theta \\[10pt] \rightarrow \sum_{i=1}^{n}X_i^1/n &= \hat{k}\hat{\theta} \\[15pt] \therefore \hat{k} &= \dfrac{\bar{X}_n}{\hat{\theta}} \end{aligned}

아래 추정된 θ^\hat{\theta}를 이용하여 k^\hat{k} 추정

k^=Xnˉ/i=1n(XiXnˉ)2nXnˉ=(nXnˉ)2i=1n(XiXnˉ)2\begin{aligned} \hat{k} &=\bar{X_n}/\dfrac{\sum_{i=1}^{n}(X_i-\bar{X_n})^2}{n\bar{X_n}} \\[15pt] &=\dfrac{(n\bar{X_n})^2}{\sum_{i=1}^{n}(X_i-\bar{X_n})^2} \end{aligned}

2) θ^\hat{\theta}추정

m2=μ2(k,θ)=kθ2+k2θ2=kθ(θ+kθ)i=1nXi2/n=k^θ^(θ^+k^θ^)=m1(θ^+m1)θ^=m2(m1)2m1=i=1nXi2/n(Xˉn)2Xˉn=i=1nXi2n(Xˉn)2nXˉn=i=1nXi2i=1n(Xˉn)2nXˉn=i=1n(XiXˉn)2nXˉn\begin{aligned} m_2'&=\mu_2'(k,\theta)= k\theta^2+k^2\theta^2 = k\theta(\theta+k\theta) \\[10pt] \rightarrow \sum_{i=1}^{n}X_i^2/n &= \hat{k}\hat{\theta}(\hat{\theta}+\hat{k}\hat{\theta}) = m_1'(\hat{\theta}+m_1') \\[10pt] \therefore \hat{\theta} &= \dfrac{m_2'-(m_1')^2}{m_1'} \\[10pt] &=\dfrac{\sum_{i=1}^{n}X_i^2/n-\left(\bar{X}_n\right)^2}{\bar{X}_n} \\[10pt] &=\dfrac{\sum_{i=1}^{n}X_i^2-n\left(\bar{X}_n\right)^2}{n\bar{X}_n} \\[10pt] &=\dfrac{\sum_{i=1}^{n}X_i^2-\sum_{i=1}^{n}\left(\bar{X}_n\right)^2}{n\bar{X}_n} \\[10pt] &=\dfrac{\sum_{i=1}^{n}(X_i-\bar{X}_n)^2}{n\bar{X}_n} \end{aligned}

0개의 댓글