[통계] 푸아송 분포

hyun·2022년 8월 13일
0

통계

목록 보기
15/37

📚 푸아송 분포 (Poisson Distribution)

푸아송 분포의 확률밀도함수는 다음과 같이 정의된다.

XPX(x)=λxeλx!,  x=0,  1,  2,  ...X \sim P_X(x)=\frac{\lambda^xe^{-\lambda}}{x!} ,\; x=0,\; 1,\; 2,\; ...\\

이는 주로 일정한 시간 혹은 공간 단위에서 평균적인 사건의 수에 대한 분포를 나타낸다. (일정 시간 발생하는 트래픽, 1시간동안 걸려오는 전화...)
푸아송 분포는 파라미터 λ\lambda를 사용한다. (평균=분산=λ\lambda)

이 때 람다는 일정 구간 안에서 발생한 평균 사건의 수가 된다.

📚 평균과 분산

증명은 생략하겠지만, 푸아송 분포의 평균과 분산은 파라미터 그대로 람다가 된다.
확률변수 XX가 푸아송 분포를 따를 때, XX의 평균과 분산은

E[X]=λE[X] = \lambda
Var[X]=λVar[X] = \lambda

📚 그리기

import numpy as np
import matplotlib.pyplot as plt
from math import factorial, exp

# Probability density of the Poisson distribution
def pois_dist(n, lamb):
    pd = (lamb ** n) * exp(-lamb) / factorial(n)
    return pd


x = np.arange(40)
pd1 = np.array([pois_dist(n, 10) for n in range(40)])
plt.ylim(0, 0.15)
plt.text(33.5, 0.14, 'lamb = 10')
plt.bar(x, pd1, color='lightcoral')
plt.show()


신기하게 생긴 친구다.

참고
https://codetorial.net/articles/poisson_distribution.html

0개의 댓글