포아송 분포(Poisson Distribution)
1. Poisson 분포 정의
Poisson 분포 는 0 이상의 정수값( 0 , 1 , 2 , … ) (0, 1, 2, \dots) ( 0 , 1 , 2 , … ) 을 갖는 확률변수를 다룰 때 사용되는 이산 확률분포 입니다.
일반적으로 다음과 같은 형태의 확률질량함수(PMF)를 갖습니다.
[ X ∼ P o i s s o n ( λ ) ⟹ P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , … ] [ X \sim \mathrm{Poisson}(\lambda) \quad \Longrightarrow \quad P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots ] [ X ∼ P o i s s o n ( λ ) ⟹ P ( X = k ) = k ! λ k e − λ , k = 0 , 1 , 2 , … ]
여기서
( λ > 0 ) ( \lambda > 0) ( λ > 0 ) 는 평균 발생 횟수 (단위시간·단위공간 등에서 기대되는 사건 발생 횟수)를 뜻합니다.
k ! k! k ! 는 k k k 의 팩토리얼(factorial)입니다.
2. Poisson 분포의 의미
Poisson 분포는 흔히 “일정 시간(또는 구간) 내에 발생하는 사건의 횟수” 를 모델링할 때 사용됩니다.
예를 들어,
특정 시간 구간에서 전화가 걸려오는 횟수
부품이 고장나는 횟수
웹사이트에 들어오는 방문자 수
등이 매우 짧은 간격에도 단 한 번씩만(동시에 여러 번 X) 발생하고, “단위 구간당 평균 발생 횟수λ \lambda λ ”가 어느 정도 일정하다고 가정할 때 자연스럽게 Poisson 분포가 적용됩니다.
λ \lambda λ 가 클수록 사건이 자주 발생하며, 그만큼 분산 도 커집니다.
Poisson 분포는 사건들이 “순수 무작위”로, 서로 독립적으로 일어난다는 가정과도 밀접한 관련이 있습니다.
3. Binomial Distribution의 특정한 경우를 통한 Poisson Distribution의 유도 과정
보통 교과서에서는 이항 분포(Binomial distribution) 의 극한 과정을 통해 Poisson 분포를 유도합니다.
아래와 같은 전형적인 상황을 생각해봅시다.
B i n o m i a l ( n , λ n ) \mathrm{Binomial}(n, \frac{\lambda}{n}) B i n o m i a l ( n , n λ ) 에서 P o i s s o n ( λ ) \mathrm{Poisson}(\lambda) P o i s s o n ( λ ) 로 수렴하는 과정
이항 분포 B i n o m i a l ( n , p ) \mathrm{Binomial}(n, p) B i n o m i a l ( n , p ) 의 확률질량함수(PMF)는
[ P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n ] [ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k=0,1,\ldots,n ] [ P ( X = k ) = ( k n ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n ]
에서, p → 0 p \to 0 p → 0 , n → ∞ n \to \infty n → ∞ 로 보내되, λ = n p \lambda = n p λ = n p 는 고정한다고 합시다.
즉, 시행 횟수를 무한히 늘리고, 시행 횟수가 늘어나는 속도와 동일하게 발생 확률 을 낮추어, 평균 발생 확률은 동일하게 유지가 되는 상황입니다. 이때,
[ P ( X = k ) = ( n k ) ( λ n ) k ( 1 − λ n ) n − k ] [ P(X = k) = \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} ] [ P ( X = k ) = ( k n ) ( n λ ) k ( 1 − n λ ) n − k ]
이 식이 n → ∞ n \to \infty n → ∞ 에서 λ k e − λ k ! \frac{\lambda^k e^{-\lambda}}{k!} k ! λ k e − λ 로 수렴함을 좀 더 자세하게 살펴보겠습니다.
1) 식을 세 부분으로 나누어 보기
( n k ) ( λ n ) k ( 1 − λ n ) n − k = ( n k ) ⏟ (a) × ( λ n ) k ⏟ (b) × ( 1 − λ n ) n − k ⏟ (c) \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} \;\;=\;\; \underbrace{\binom{n}{k}}_{\text{(a)}} \times \underbrace{\left(\frac{\lambda}{n}\right)^k}_{\text{(b)}} \times \underbrace{\left(1 - \frac{\lambda}{n}\right)^{n-k}}_{\text{(c)}} ( k n ) ( n λ ) k ( 1 − n λ ) n − k = (a) ( k n ) × (b) ( n λ ) k × (c) ( 1 − n λ ) n − k
(a) ( n k ) \displaystyle \binom{n}{k} ( k n )
(b) ( λ n ) k \displaystyle \Bigl(\frac{\lambda}{n}\Bigr)^k ( n λ ) k
(c) ( 1 − λ n ) n − k \displaystyle \Bigl(1 - \frac{\lambda}{n}\Bigr)^{\,n-k} ( 1 − n λ ) n − k
이 세 부분을 각각 전개·근사하여 n → ∞ n \to \infty n → ∞ 에서의 값을 구합니다.
2) ( a ) = ( n k ) (a)=\binom{n}{k} ( a ) = ( k n ) 의 전개
( n k ) = n ! k ! ( n − k ) ! = n ( n − 1 ) ⋯ ( n − k + 1 ) k ! \binom{n}{k} = \frac{n!}{k!\,(n-k)!} = \frac{n \,(n-1)\,\cdots\,(n-k+1)}{k!} ( k n ) = k ! ( n − k ) ! n ! = k ! n ( n − 1 ) ⋯ ( n − k + 1 )
이 곱을 n n n 으로 묶어서 보면,
n ( n − 1 ) ⋯ ( n − k + 1 ) = n k ( 1 − 1 n ) ( 1 − 2 n ) ⋯ ( 1 − k − 1 n ) n \,(n-1)\,\cdots\,(n-k+1) = n^k \left(1 - \tfrac{1}{n}\right)\left(1 - \tfrac{2}{n}\right)\cdots\left(1 - \tfrac{k-1}{n}\right) n ( n − 1 ) ⋯ ( n − k + 1 ) = n k ( 1 − n 1 ) ( 1 − n 2 ) ⋯ ( 1 − n k − 1 )
즉,
( n k ) = n k k ! ∏ j = 0 k − 1 ( 1 − j n ) \binom{n}{k} = \frac{n^k}{k!} \prod_{j=0}^{k-1}\left(1 - \frac{j}{n}\right) ( k n ) = k ! n k j = 0 ∏ k − 1 ( 1 − n j )
3) ( b ) = ( λ n ) k (b)=\Bigl(\frac{\lambda}{n}\Bigr)^k ( b ) = ( n λ ) k
( λ n ) k = λ k n k \left(\frac{\lambda}{n}\right)^k = \frac{\lambda^k}{n^k} ( n λ ) k = n k λ k
4) ( a ) × ( b ) (a)\times(b) ( a ) × ( b ) 를 곱해 보기
( n k ) ( λ n ) k = [ n k k ! ∏ j = 0 k − 1 ( 1 − j n ) ] × λ k n k \binom{n}{k} \left(\frac{\lambda}{n}\right)^k = \biggl[\frac{n^k}{k!} \prod_{j=0}^{k-1}\Bigl(1 - \tfrac{j}{n}\Bigr)\biggr] \times \frac{\lambda^k}{n^k} ( k n ) ( n λ ) k = [ k ! n k j = 0 ∏ k − 1 ( 1 − n j ) ] × n k λ k
여기서 n k n^k n k 와 1 n k \tfrac{1}{n^k} n k 1 가 상쇄되어,
= λ k k ! ∏ j = 0 k − 1 ( 1 − j n ) = \frac{\lambda^k}{k!} \prod_{j=0}^{k-1}\Bigl(1 - \tfrac{j}{n}\Bigr) = k ! λ k j = 0 ∏ k − 1 ( 1 − n j )
j = 0 j=0 j = 0 일 때 항은 ( 1 − 0 / n ) = 1 \bigl(1 - 0/n\bigr) = 1 ( 1 − 0 / n ) = 1 이므로 실질적으로∏ j = 0 k − 1 ( 1 − j n ) = 1 \prod_{j=0}^{k-1}\Bigl(1 - \tfrac{j}{n}\Bigr) = 1 j = 0 ∏ k − 1 ( 1 − n j ) = 1
이제 n → ∞ n \to \infty n → ∞ 일 때, 각 항 ( 1 − j n ) → 1 \bigl(1 - \tfrac{j}{n}\bigr) \to 1 ( 1 − n j ) → 1 .
따라서
lim n → ∞ ( n k ) ( λ n ) k = λ k k ! \lim_{n\to\infty} \binom{n}{k} \Bigl(\tfrac{\lambda}{n}\Bigr)^k = \frac{\lambda^k}{k!} n → ∞ lim ( k n ) ( n λ ) k = k ! λ k
5)( c ) = ( 1 − λ n ) n − k (c)=\Bigl(1 - \frac{\lambda}{n}\Bigr)^{n-k} ( c ) = ( 1 − n λ ) n − k
( 1 − λ n ) n − k = ( 1 − λ n ) n × ( 1 − λ n ) − k \left(1 - \frac{\lambda}{n}\right)^{n-k} = \left(1 - \frac{\lambda}{n}\right)^n \times \left(1 - \frac{\lambda}{n}\right)^{-k} ( 1 − n λ ) n − k = ( 1 − n λ ) n × ( 1 − n λ ) − k
( 1 − λ n ) n → n → ∞ e − λ \displaystyle \left(1 - \tfrac{\lambda}{n}\right)^n \xrightarrow[n\to\infty]{} e^{-\lambda} ( 1 − n λ ) n n → ∞ e − λ
( 1 − λ n ) − k → n → ∞ 1 \displaystyle \left(1 - \tfrac{\lambda}{n}\right)^{-k} \xrightarrow[n\to\infty]{} 1 ( 1 − n λ ) − k n → ∞ 1 (왜냐하면 k k k 는 고정된 유한 수).
결국,
lim n → ∞ ( 1 − λ n ) n − k = e − λ \lim_{n \to \infty} \left(1 - \frac{\lambda}{n}\right)^{n-k} = e^{-\lambda} n → ∞ lim ( 1 − n λ ) n − k = e − λ
6) 최종 합성
( a ) × ( b ) (a)\times(b) ( a ) × ( b ) 의 극한 결과( λ k k ! ) \bigl(\tfrac{\lambda^k}{k!}\bigr) ( k ! λ k ) 에, c c c 의 극한 e − λ e^{-\lambda} e − λ 를 곱하면,
lim n → ∞ ( n k ) ( λ n ) k ( 1 − λ n ) n − k = λ k k ! × e − λ = λ k e − λ k ! \lim_{n\to\infty} \binom{n}{k} \Bigl(\tfrac{\lambda}{n}\Bigr)^k \Bigl(1 - \tfrac{\lambda}{n}\Bigr)^{n-k} = \frac{\lambda^k}{k!} \,\times\, e^{-\lambda} = \frac{\lambda^k e^{-\lambda}}{k!} n → ∞ lim ( k n ) ( n λ ) k ( 1 − n λ ) n − k = k ! λ k × e − λ = k ! λ k e − λ
즉,
B i n o m i a l ( n , λ n ) → n → ∞ P o i s s o n ( λ ) \boxed{ \mathrm{Binomial}\Bigl(n, \frac{\lambda}{n}\Bigr) \;\;\xrightarrow[n\to\infty]{}\;\; \mathrm{Poisson}(\lambda) } B i n o m i a l ( n , n λ ) n → ∞ P o i s s o n ( λ )
이로써 이항 분포 가 Poisson 분포 로 수렴한다는 것이 명시적으로 보이며, 해당 식이 Poisson 분포의 확률질량함수(PMF),
P ( X = k ) = λ k e − λ k ! P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} P ( X = k ) = k ! λ k e − λ
로 딱 맞아떨어집니다.
4. Poisson 분포를 따르는 Random Value의 특징
(1) Mean = Variance
Poisson 분포의 가장 유명한 특징 중 하나는
E [ X ] = λ , V a r ( X ) = λ \boxed{ E[X] = \lambda, \quad \mathrm{Var}(X) = \lambda} E [ X ] = λ , V a r ( X ) = λ
즉, 평균과 분산이 동일 하다는 점입니다.
이는 Poisson 분포가 “단일 파라미터 λ \lambda λ ” 하나에 의해 결정됨을 의미합니다.
사건이 완전히 무작위(독립적)로 발생하는 경우, “평균 발생 횟수 = 분산”인 구조가 자연스럽게 나타납니다.
(2) 왜 Mean과 Variance가 같은가?
--증명 추가 예정--
1. 정의 자체가 그렇게 만들어져 있음
Poisson 분포는 “평균 발생 횟수”가 λ \lambda λ 인 과정을 수학적으로 모델화한 결과입니다.
무작위 사건 발생(=완전 랜덤)의 경우, 평균에서 벗어나는 정도도 λ \lambda λ 와 동일한 크기가 된다고 보아, 분산도 λ \lambda λ 가 됩니다.
포아송 과정(Poisson Process)에서의 사건 발생 해석
작은 시간 구간에서도 사건이 동시에 여러 번 발생할 확률이 매우 작으며,
각 시간 구간(또는 공간 구간)별 사건 발생 수가 독립적이고,
전체 구간 내 발생 횟수를 세어보면, 자연스럽게 P o i s s o n ( λ ) Poisson(\lambda) P o i s s o n ( λ ) 분포 형태가 됨.
이때 “평균”도 “변동 폭(분산)”도 동일한 값을 갖게 됩니다.
결국, Poisson 분포가 나타나는 상황(매개변수 λ \lambda λ 로 특징지어지는 순수 무작위 발생)에서, 사건 횟수의 평균 과 분산 이 모두 λ \lambda λ 에 의해 동일하게 결정된다는 사실은 Poisson 분포의 핵심적인 특징이자, 이를 통해 Poisson 분포인지 간단히 식별하는 방법 중 하나가 됩니다.
참고 및 요약
정의 P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , … P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k=0,1,2,\dots P ( X = k ) = k ! λ k e − λ , k = 0 , 1 , 2 , …
의미 : 특정 시간/공간 구간 내 사건(횟수)가 순수 무작위로 발생할 때, 그 횟수는 P o i s s o n ( λ ) Poisson(\lambda) P o i s s o n ( λ ) 분포로 모델링 가능.
유도 과정 : B i n o m i a l ( n , p ) Binomial(n,p) B i n o m i a l ( n , p ) 에서 n → ∞ n\to\infty n → ∞ , p → 0 p \to 0 p → 0 , n p = λ np = \lambda n p = λ 고정 → P o i s s o n ( λ ) Poisson(\lambda) P o i s s o n ( λ ) 극한.
특징 : 평균과 분산이 λ \lambda λ 로 동일. 이는 Poisson 분포가 갖는 대표적인 성질이며, 완전 무작위 발생을 수학적으로 표현한 결과.
위 내용을 통해 Poisson 분포가 왜 중요한지, 어떻게 등장하는지, 어떤 성질을 갖는지 이해할 수 있습니다.