Poisson distribution

Kim Min hyuk·2024년 12월 23일
0

포아송 분포(Poisson Distribution)


1. Poisson 분포 정의

Poisson 분포는 0 이상의 정수값(0,1,2,)(0, 1, 2, \dots)을 갖는 확률변수를 다룰 때 사용되는 이산 확률분포입니다.
일반적으로 다음과 같은 형태의 확률질량함수(PMF)를 갖습니다.

[XPoisson(λ)P(X=k)=λkeλk!,k=0,1,2,][ X \sim \mathrm{Poisson}(\lambda) \quad \Longrightarrow \quad P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots ]

여기서

  • (λ>0)( \lambda > 0)평균 발생 횟수(단위시간·단위공간 등에서 기대되는 사건 발생 횟수)를 뜻합니다.
  • k!k!kk의 팩토리얼(factorial)입니다.

2. Poisson 분포의 의미

Poisson 분포는 흔히 “일정 시간(또는 구간) 내에 발생하는 사건의 횟수”를 모델링할 때 사용됩니다.
예를 들어,

  • 특정 시간 구간에서 전화가 걸려오는 횟수
  • 부품이 고장나는 횟수
  • 웹사이트에 들어오는 방문자 수

등이 매우 짧은 간격에도 단 한 번씩만(동시에 여러 번 X) 발생하고, “단위 구간당 평균 발생 횟수λ\lambda”가 어느 정도 일정하다고 가정할 때 자연스럽게 Poisson 분포가 적용됩니다.

λ\lambda가 클수록 사건이 자주 발생하며, 그만큼 분산도 커집니다.
Poisson 분포는 사건들이 “순수 무작위”로, 서로 독립적으로 일어난다는 가정과도 밀접한 관련이 있습니다.


3. Binomial Distribution의 특정한 경우를 통한 Poisson Distribution의 유도 과정

보통 교과서에서는 이항 분포(Binomial distribution)의 극한 과정을 통해 Poisson 분포를 유도합니다.
아래와 같은 전형적인 상황을 생각해봅시다.

Binomial(n,λn)\mathrm{Binomial}(n, \frac{\lambda}{n})에서 Poisson(λ)\mathrm{Poisson}(\lambda)로 수렴하는 과정

이항 분포 Binomial(n,p)\mathrm{Binomial}(n, p)의 확률질량함수(PMF)는

[P(X=k)=(nk)pk(1p)nk,k=0,1,,n][ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k=0,1,\ldots,n ]

에서, p0p \to 0, nn \to \infty로 보내되, λ=np\lambda = n p는 고정한다고 합시다.
즉, 시행 횟수를 무한히 늘리고, 시행 횟수가 늘어나는 속도와 동일하게 발생 확률을 낮추어, 평균 발생 확률은 동일하게 유지가 되는 상황입니다. 이때,

[P(X=k)=(nk)(λn)k(1λn)nk][ P(X = k) = \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} ]

이 식이 nn \to \infty에서 λkeλk!\frac{\lambda^k e^{-\lambda}}{k!}로 수렴함을 좀 더 자세하게 살펴보겠습니다.


1) 식을 세 부분으로 나누어 보기

(nk)(λn)k(1λn)nk    =    (nk)(a)×(λn)k(b)×(1λn)nk(c)\binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} \;\;=\;\; \underbrace{\binom{n}{k}}_{\text{(a)}} \times \underbrace{\left(\frac{\lambda}{n}\right)^k}_{\text{(b)}} \times \underbrace{\left(1 - \frac{\lambda}{n}\right)^{n-k}}_{\text{(c)}}
  • (a) (nk)\displaystyle \binom{n}{k}
  • (b) (λn)k\displaystyle \Bigl(\frac{\lambda}{n}\Bigr)^k
  • (c) (1λn)nk\displaystyle \Bigl(1 - \frac{\lambda}{n}\Bigr)^{\,n-k}
    이 세 부분을 각각 전개·근사하여 nn \to \infty에서의 값을 구합니다.

2) (a)=(nk)(a)=\binom{n}{k}의 전개

(nk)=n!k!(nk)!=n(n1)(nk+1)k!\binom{n}{k} = \frac{n!}{k!\,(n-k)!} = \frac{n \,(n-1)\,\cdots\,(n-k+1)}{k!}

이 곱을 nn으로 묶어서 보면,

n(n1)(nk+1)=nk(11n)(12n)(1k1n)n \,(n-1)\,\cdots\,(n-k+1) = n^k \left(1 - \tfrac{1}{n}\right)\left(1 - \tfrac{2}{n}\right)\cdots\left(1 - \tfrac{k-1}{n}\right)

즉,

(nk)=nkk!j=0k1(1jn)\binom{n}{k} = \frac{n^k}{k!} \prod_{j=0}^{k-1}\left(1 - \frac{j}{n}\right)

3) (b)=(λn)k(b)=\Bigl(\frac{\lambda}{n}\Bigr)^k

(λn)k=λknk\left(\frac{\lambda}{n}\right)^k = \frac{\lambda^k}{n^k}

4) (a)×(b)(a)\times(b)를 곱해 보기

(nk)(λn)k=[nkk!j=0k1(1jn)]×λknk\binom{n}{k} \left(\frac{\lambda}{n}\right)^k = \biggl[\frac{n^k}{k!} \prod_{j=0}^{k-1}\Bigl(1 - \tfrac{j}{n}\Bigr)\biggr] \times \frac{\lambda^k}{n^k}

여기서 nkn^k1nk\tfrac{1}{n^k}가 상쇄되어,

=λkk!j=0k1(1jn)= \frac{\lambda^k}{k!} \prod_{j=0}^{k-1}\Bigl(1 - \tfrac{j}{n}\Bigr)
  • j=0j=0일 때 항은 (10/n)=1\bigl(1 - 0/n\bigr) = 1 이므로 실질적으로
    j=0k1(1jn)=1\prod_{j=0}^{k-1}\Bigl(1 - \tfrac{j}{n}\Bigr) = 1

이제 nn \to \infty일 때, 각 항 (1jn)1\bigl(1 - \tfrac{j}{n}\bigr) \to 1.
따라서

limn(nk)(λn)k=λkk!\lim_{n\to\infty} \binom{n}{k} \Bigl(\tfrac{\lambda}{n}\Bigr)^k = \frac{\lambda^k}{k!}

5)(c)=(1λn)nk(c)=\Bigl(1 - \frac{\lambda}{n}\Bigr)^{n-k}

(1λn)nk=(1λn)n×(1λn)k\left(1 - \frac{\lambda}{n}\right)^{n-k} = \left(1 - \frac{\lambda}{n}\right)^n \times \left(1 - \frac{\lambda}{n}\right)^{-k}
  1. (1λn)nneλ\displaystyle \left(1 - \tfrac{\lambda}{n}\right)^n \xrightarrow[n\to\infty]{} e^{-\lambda}
  2. (1λn)kn1\displaystyle \left(1 - \tfrac{\lambda}{n}\right)^{-k} \xrightarrow[n\to\infty]{} 1 (왜냐하면 kk는 고정된 유한 수).

결국,

limn(1λn)nk=eλ\lim_{n \to \infty} \left(1 - \frac{\lambda}{n}\right)^{n-k} = e^{-\lambda}

6) 최종 합성

(a)×(b)(a)\times(b)의 극한 결과(λkk!)\bigl(\tfrac{\lambda^k}{k!}\bigr)에, cc의 극한 eλe^{-\lambda}를 곱하면,

limn(nk)(λn)k(1λn)nk=λkk!×eλ=λkeλk!\lim_{n\to\infty} \binom{n}{k} \Bigl(\tfrac{\lambda}{n}\Bigr)^k \Bigl(1 - \tfrac{\lambda}{n}\Bigr)^{n-k} = \frac{\lambda^k}{k!} \,\times\, e^{-\lambda} = \frac{\lambda^k e^{-\lambda}}{k!}

즉,

Binomial(n,λn)    n    Poisson(λ)\boxed{ \mathrm{Binomial}\Bigl(n, \frac{\lambda}{n}\Bigr) \;\;\xrightarrow[n\to\infty]{}\;\; \mathrm{Poisson}(\lambda) }

이로써 이항 분포Poisson 분포로 수렴한다는 것이 명시적으로 보이며, 해당 식이 Poisson 분포의 확률질량함수(PMF),

P(X=k)=λkeλk!P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}

로 딱 맞아떨어집니다.

4. Poisson 분포를 따르는 Random Value의 특징

(1) Mean = Variance

Poisson 분포의 가장 유명한 특징 중 하나는

E[X]=λ,Var(X)=λ\boxed{ E[X] = \lambda, \quad \mathrm{Var}(X) = \lambda}

즉, 평균과 분산이 동일하다는 점입니다.

  • 이는 Poisson 분포가 “단일 파라미터 λ\lambda” 하나에 의해 결정됨을 의미합니다.
  • 사건이 완전히 무작위(독립적)로 발생하는 경우, “평균 발생 횟수 = 분산”인 구조가 자연스럽게 나타납니다.

(2) 왜 Mean과 Variance가 같은가?

--증명 추가 예정--
1. 정의 자체가 그렇게 만들어져 있음

  • Poisson 분포는 “평균 발생 횟수”가 λ\lambda인 과정을 수학적으로 모델화한 결과입니다.
  • 무작위 사건 발생(=완전 랜덤)의 경우, 평균에서 벗어나는 정도도 λ\lambda와 동일한 크기가 된다고 보아, 분산도 λ\lambda가 됩니다.
  1. 포아송 과정(Poisson Process)에서의 사건 발생 해석
    • 작은 시간 구간에서도 사건이 동시에 여러 번 발생할 확률이 매우 작으며,
    • 각 시간 구간(또는 공간 구간)별 사건 발생 수가 독립적이고,
    • 전체 구간 내 발생 횟수를 세어보면, 자연스럽게 Poisson(λ)Poisson(\lambda) 분포 형태가 됨.
    • 이때 “평균”도 “변동 폭(분산)”도 동일한 값을 갖게 됩니다.

결국, Poisson 분포가 나타나는 상황(매개변수 λ\lambda로 특징지어지는 순수 무작위 발생)에서, 사건 횟수의 평균분산이 모두 λ\lambda에 의해 동일하게 결정된다는 사실은 Poisson 분포의 핵심적인 특징이자, 이를 통해 Poisson 분포인지 간단히 식별하는 방법 중 하나가 됩니다.


참고 및 요약

  1. 정의
    P(X=k)=λkeλk!,k=0,1,2,P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k=0,1,2,\dots
  2. 의미: 특정 시간/공간 구간 내 사건(횟수)가 순수 무작위로 발생할 때, 그 횟수는 Poisson(λ)Poisson(\lambda) 분포로 모델링 가능.
  3. 유도 과정: Binomial(n,p)Binomial(n,p)에서 nn\to\infty, p0p \to 0, np=λnp = \lambda 고정 → Poisson(λ)Poisson(\lambda) 극한.
  4. 특징: 평균과 분산이 λ\lambda로 동일. 이는 Poisson 분포가 갖는 대표적인 성질이며, 완전 무작위 발생을 수학적으로 표현한 결과.

위 내용을 통해 Poisson 분포가 왜 중요한지, 어떻게 등장하는지, 어떤 성질을 갖는지 이해할 수 있습니다.

0개의 댓글