포아송 분포
포아송 분포는 기준 간격이나 시간, 거리, 공간에서 특정 사건이 발생하는 횟수에 대한 확률 분포다.
예를 들어 1년 동안 태풍이 한국에 직접적으로 닿는 횟수, 08:00부터 17:00까지 학교 정문에 사람이 들어오는 사건의 횟수들을 포아송 분포로 모델링할 수 있다.
포아송 분포는 한 구간에서 평균적으로 발생하는 사건의 횟수를 파라미터로 받으며, 확률 함수는 다음과 같다.
X∼Poisson(λ)fX(x)=x!e−λλxI(x∈{0,1,2,...}Xi∼Poisson(λi),Xi′s are indep.⇒Y=∑Xi∼Poisson(∑λi)
포아송 분포를 이용한 지수 분포 도출
포아송 분포가 일정 구간에서의 사건의 발생 횟수를 의미한다면, 첫 사건의 발생까지 걸리는 시간도 확률 변수로 볼 수 있다. 이는 다음의 과정에 의해 도출된다.
포아송 과정 Xt는 t시간 동안 특정 사건이 발생한 횟수로 정의된다.
P(t시간 동안 사건 미발생)=P(Xt=0)=e−λt=P(첫 발생까지의 시간>t)⇒P(첫 발생까지의 시간≤t)=1−e−λtY:첫 사건의 발생까지의 시간FY(y)=P(Y≤t)=1−e−λt⇒fY(y)=λe−λyI(λ>0)
지수 분포
이 때 확률 변수 Y의 분포를 지수 분포라고 한다. 즉, 확률 변수 X가 평균 사건 발생 횟수가 λ인 분포일 때, 첫 사건 발생까지의 시간(대기 시간)을 확률 분포로 모델링한 것이 지수 분포다.
Y∼exponential(λ)fY(y)=λe−λyI(y>0)
지수 분포의 무기억성(memoryless property)
지수 분포는 다음과 같은 성질을 만족한다.
즉 이미 지난 시간 s가 주어졌을 때, 앞으로 t시간만큼 더 기다리는 사건의 확률은 이미 s시간만큼 기다렸다는 정보와 독립적이다.
다시 말해 지금까지 몇 시간이 지났건 앞으로 t시간만큼 기다려야 사건이 발생할 확률은 동일하다.
P(Y>s+t∣Y>s)=P(Y>t)Proof)P(Y>s+t∣Y>s)=P(Y>s)P(Y>s+t,Y>s)=P(Y>s)P(Y>s+t)=1−P(Y≤s)1−P(Y≤s+t)=1−FY(s)1−FY(s+t)=e−λse−λ(s+t)=e−λt=1−(1−e−λt)=1−P(Y≤t)=P(Y>t)∴P(Y>s+t∣Y>s)=P(Y>t)