Poisson Distribution

JiHwan You·2021년 4월 24일
0

Statistics

목록 보기
1/2

Theory

Ref) Harvard Statistics110 - The Poisson distribution

Poisson Distribution 이란?

  • 표집된 단위 시간 (혹은 단위 공간)에서 발생한 사건의 도수 분포
  • 단위 시간 안에 몇 번 발생할 것인지를 표현하는 이산 확률 분포
  • 푸아송 분포의 기대값 및 분산은 λ\lambda
f(n,λ)=λneλn!f(n, \lambda)= {\lambda^ne^{-\lambda} \over n!}

PMF of Poisson Distribution

f(X=k)=λkeλk!k{0,1,2}f(X = k) = {{{\lambda ^k}{e^{ - \lambda }}} \over {k!}}\,\,\,\,\,\,k \in \{ 0,1,2 \cdots \}
  • Is it valid PMF?
k=0λkeλk!=eλeλ=1\sum\limits_{k = 0}^\infty {{{{\lambda ^k}{e^{ - \lambda }}} \over {k!}}\,} = {e^{ - \lambda }}{e^\lambda } = 1
  • Expectation value
E(X)=eλk=0kλkk!=eλk=1λk1λ(k1)!=λE(X) = {e^{ - \lambda }}\sum\limits_{k = 0}^\infty {{{k{\lambda ^k}} \over {k!}}} \\ \kern{6em} = {e^{ - \lambda }}\sum\limits_{k = 1}^\infty {{{{\lambda ^{k - 1}}\lambda } \over {(k - 1)!}}} = \lambda

When use?

  • 주어진 시간,거리,면적 등에서 임의 사건이 발생하는 횟수를 세야 하는 경우에 적합.
    • Ex) 초당 클릭 횟수, 시간당 매장에 들어오는 사람 수, 1분에 네트워크에서 손실되는 패킷 수 등
  • 굉장히 여러 번 시행하지만 성공확률이 낮은 경우에 사용.
    1. Number of emails in hour.
    2. Number of chips in chocolate chip cookies.
    3. Number of earthquakes in a year in some region.

Poisson Paradigm (Poisson Approximation)

  • Events A1A_1, A2A_2, ... AnA_n, P(Aj)=pjP(A_j)=p_j (nn is large, pjp_j is small)
  • 각각의 사건들이 "independent" or "weakly independent" 하다면,
    Then # of AjA_j's that occur is approximated as Pois(λ);λ=j=1npjPois(\lambda );\,\,\lambda = \sum\limits_{j = 1}^n {{p_j}}

이항분포가 어떻게 푸아송 분포로 수렴하려는가?

XBin(n,p)X \sim Bin(n,p), let nn\to\infty, λ=np\lambda=np is held constant.
Find what happens to
P(X=k)=(nk)pk(1p)nk\kern{3em}P(X=k)=(\substack{n\\k})p^k(1-p)^{n-k}, kk is fixed.
=n(n1)(nk+1)k!λknk(1λn)n(1λn)k\kern{7.6em}= {{n(n - 1) \cdots (n - k + 1)} \over {k!}}{{{\lambda ^k}} \over {{n^k}}}{\left( {1 - {\lambda \over n}} \right)^n}{\left( {1 - {\lambda \over n}} \right)^{ - k}}
=λkk!eλ\kern{7.6em}= {{{\lambda ^k}} \over {k!}}{e^{ - \lambda }}, Poisson PMF at kk


Practice (MATLAB)

Ref) MATLAB Poisson distribution

푸아송 분포의 pdf 계산하기

모수 lambda=4 를 갖는 푸아송 분포의 pdf를 계산해보자.

x = 0:15;
y = poisspdf(x, 4);

figure();
bar(x,y,1)
xlabel('Observation')
ylabel('Probability')

푸아송 분포의 cdf 계산하기

x = 0:15;
y = poisscdf(x,4);

figure;
stairs(x,y)
xlabel('Observation')
ylabel('Cumulative Probability')

푸아송 분포 pdf와 정규분포 pdf 비교하기

labmda가 크면 푸아송 분포는 평균 lambda와 분산 lambda를 갖는 정규분포로 근사가 가능하다.
모수 labmda=50을 갖는 푸아송 분포의 pdf를 계산해보자.

lambda = 50;
x1 = 0:100;
y1 = poisspdf(x1, lambda);

mu = lambda;
sigma = sqrt(lambda);
x2 = 0:0.1:100;
y2 = normpdf(x2,mu,sigma);

figure;
bar(x1, y1, 1)
hold on
plot(x2, y2, 'LineWidth', 2)
xlabel('Observation')
ylabel('Probability')
title('Poisson and Normal pdfs')
legend('Poisson Distribution', 'Normal distribution', 'location', 'northwest')
hold off

profile
고독. 지식. 탐구

0개의 댓글