1. 포아송 분포 정의
포아송 분포 X∼Poisson(λ)는 단위 시간(또는 공간) 내에서 발생하는 사건의 횟수를 설명하는 분포로, 확률 질량 함수(PMF)는 다음과 같습니다:
P(X=k∣λ)=k!λke−λ,k=0,1,2,…
여기서,
- λ>0는 단위 시간당 평균 발생 횟수(기댓값)입니다.
- k!는 k의 계승(factorial)입니다.
2. 우도함수 (Likelihood Function)
(1) 독립 표본을 고려한 우도함수
포아송 분포를 따르는 독립적인 표본 X1,X2,…,Xn이 주어졌다고 하자. 각 Xi는 서로 독립적으로 Poisson(λ)를 따른다고 가정하면, 전체 표본의 공동 확률 (즉, 우도함수)는 각 개별 확률의 곱으로 주어집니다:
L(λ∣X1,X2,…,Xn)=i=1∏nP(Xi∣λ)
이를 포아송 분포의 PMF를 이용하여 전개하면,
L(λ)=i=1∏nXi!λXie−λ
(2) 우도함수 정리
위 식을 정리하면,
L(λ)=(i=1∏nXi!1)λ∑i=1nXie−nλ
여기서 총합을 다음과 같이 정의하면 편리합니다:
S=i=1∑nXi
그러면 우도함수는 다음과 같이 간략히 표현됩니다:
L(λ)=(i=1∏nXi!1)λSe−nλ
3. 로그 우도함수 (Log-Likelihood Function)
계산을 단순하게 하기 위해 로그 우도함수를 구합니다:
ℓ(λ)=logL(λ)
로그를 취하면,
ℓ(λ)=log[(i=1∏nXi!1)λSe−nλ]
로그의 성질을 이용하여 항별로 나누면,
ℓ(λ)=i=1∑nlogXi!1+logλS+loge−nλ
이를 다시 정리하면,
ℓ(λ)=−i=1∑nlogXi!+Slogλ−nλ
즉, 로그 우도함수는 다음과 같습니다:
ℓ(λ)=Slogλ−nλ−i=1∑nlogXi!
(여기서 ∑i=1nlogXi! 항은 λ에 영향을 주지 않으므로, 최적화 과정에서는 상수로 취급할 수 있습니다.)
4. 최대우도추정량 (MLE)
우도함수를 최대화하는 λ 값을 찾기 위해, 로그 우도함수를 λ에 대해 미분하고 0으로 설정합니다:
dλdℓ(λ)=λS−n=0
이를 풀면,
λ^=nS=n1i=1∑nXi
즉, 포아송 분포의 최대우도추정량(MLE)은 단순히 표본 평균이 됩니다:
λ^=Xˉ
5. 요약
-
포아송 분포에서의 우도함수는:
L(λ)=(i=1∏nXi!1)λSe−nλ
-
로그 우도함수는:
ℓ(λ)=Slogλ−nλ−i=1∑nlogXi!
-
우도함수를 최대화하는 λ의 최대우도추정량(MLE)은:
λ^=n1i=1∑nXi
이와 같이 포아송 분포에서는 표본 평균이 MLE가 됩니다.