음이항분포와 포아송분포 간의 관계

·2025년 3월 25일
0

포아송 분포에 과산포가 있으면 음이항 분포를 사용한다.
왜일까?

포아송 분포에 과산포가 있다는 것은 람다가 일정하지 않다는 것이다.
따라서 고정되지 않고 변하는 람다를 어떤 분포를 가진 값으로 모델링해야 한다.

이건 마치 t-검정에서 분산에 카이제곱분포를 쓰는 것과 유사하다.

키가 보통정규분포를 따른다고 가정하는 것처럼 람다는 감마분포를 따른다고 가정한다. 이 때 감마분포를따른다고 가정하는 것이지, 람다가 어떤 분포를 따른다는 확정적인 사실은 없다. 감마분포를 선택하게 되는 이유는, 정의역이 (0,)(0, \infty)이고, 모양의 조절이 쉬워서 (α\alphaβ\beta를 통해) 다양한 람다의 분포를 유연하게 표현 가능하고, 베이지안 통계에서 포아송분포의 모수 람다에 대한 사전확률분포로 감마분포를 쓰면 사후분포도 감마분포가 되기 때문이다.

포아송 분포에서 람다가 감마분포를 따른다고 가정하고 PMF를 정리하면 Binomial Negative Distribution의 PMF가 나온다.

아래는 증명

아래는 이전 증명의 모든 수식을 inline$…$, block$$…$$ 형태로 바꾸어 다시 작성한 것입니다.


목표

Poisson–Gamma 혼합으로부터 Negative Binomial PMF를 유도한다.

분포 정의

  1. 조건부 Poisson 분포:

    P(Y=yλ)=eλλyy!,y=0,1,2,P(Y=y \mid \lambda) = \frac{e^{-\lambda}\,\lambda^y}{y!},\quad y=0,1,2,\dots
  2. Gamma 분포 (shape α\alpha, rate β\beta):

    f(λ)=βαΓ(α)λα1eβλ,λ>0.f(\lambda) = \frac{\beta^\alpha}{\Gamma(\alpha)}\,\lambda^{\alpha-1}e^{-\beta\lambda},\quad \lambda>0.

주변 확률 계산

P(Y=y)=0P(Y=yλ)f(λ)dλ=0eλλyy!βαΓ(α)λα1eβλdλ.P(Y=y) = \int_0^\infty P(Y=y\mid\lambda)\,f(\lambda)\,d\lambda = \int_0^\infty \frac{e^{-\lambda}\lambda^y}{y!}\cdot\frac{\beta^\alpha}{\Gamma(\alpha)}\lambda^{\alpha-1}e^{-\beta\lambda}\,d\lambda.

식 정리:

P(Y=y)=βαΓ(α)y!0λα+y1e(β+1)λdλ.P(Y=y) = \frac{\beta^\alpha}{\Gamma(\alpha)\,y!} \int_0^\infty \lambda^{\alpha+y-1}e^{-(\beta+1)\lambda}\,d\lambda.

감마 함수 정의 0xk1eθxdx=Γ(k)θk\displaystyle\int_0^\infty x^{k-1}e^{-\theta x}dx=\frac{\Gamma(k)}{\theta^k} 를 적용하면, k=α+y, θ=β+1k=\alpha+y,\ \theta=\beta+1 이므로

0λα+y1e(β+1)λdλ=Γ(α+y)(β+1)α+y.\int_0^\infty \lambda^{\alpha+y-1}e^{-(\beta+1)\lambda}d\lambda =\frac{\Gamma(\alpha+y)}{(\beta+1)^{\alpha+y}}.

따라서

P(Y=y)=βαΓ(α)y!Γ(α+y)(β+1)α+y=Γ(α+y)Γ(α)y!(ββ+1)α(1β+1)y.P(Y=y) =\frac{\beta^\alpha}{\Gamma(\alpha)\,y!}\cdot\frac{\Gamma(\alpha+y)}{(\beta+1)^{\alpha+y}} =\frac{\Gamma(\alpha+y)}{\Gamma(\alpha)\,y!}\left(\frac{\beta}{\beta+1}\right)^\alpha\left(\frac{1}{\beta+1}\right)^y.

Negative Binomial PMF 형태

Negative Binomial(r=α, p=ββ+1r=\alpha,\ p=\frac\beta{\beta+1})의 PMF는

P(Y=y)=(y+r1y)(1p)ypr=Γ(α+y)Γ(α)y!(1β+1)y(ββ+1)α,P(Y=y)=\binom{y+r-1}{y}(1-p)^y p^r =\frac{\Gamma(\alpha+y)}{\Gamma(\alpha)\,y!}\left(\frac{1}{\beta+1}\right)^y\left(\frac{\beta}{\beta+1}\right)^\alpha,

이는 위에서 유도한 식과 완전히 일치한다.


결론:
YPoisson(λ), λGamma(α,β)YNegative Binomial(r=α, p=ββ+1).Y\sim\text{Poisson}(\lambda),\ \lambda\sim\text{Gamma}(\alpha,\beta)\quad\Longrightarrow\quad Y\sim\text{Negative Binomial}\bigl(r=\alpha,\ p=\tfrac\beta{\beta+1}\bigr).

profile
보건대학원 뉴비

0개의 댓글