통계 기초(6) - 기하, 이항, 푸아송 분포

이상해씨·2021년 10월 19일
0

통계 기초

목록 보기
6/10

◾기하 분포

  • 스노우 보드를 좋아하는 사람 A
    • 10번 도전 시 2번 성공, 한 번이라도 성공하면 집으로 복귀
    • 차드가 2번안에 성공할 확률
      • 처음에 성공할 확률 : P(X=1)=P(trial1)=0.2P(X=1) = P(trial1) = 0.2
      • 두 번째에 성공할 확률 : P(X=2)=P(trial1trial1)=0.20.8=0.16P(X=2) = P(trial1 \cap trial1) = 0.2 * 0.8 = 0.16
      • 두 번안에 성공할 확률 : P(X<=2)=P(X=1)+P(X=2)=0.2+0.16=0.36P(X<=2) = P(X=1) + P(X=2) = 0.2 + 0.16 = 0.36
      • 계속 누계를 계산하면 5에 수렴
        • E(X) = 5 라는 것을 의미
        • 성공률이 0.2이고 5번의 시도 중 1번 성공함을 의미한다.
        • 5번의 시도해야한다는 결론과 일치
    • 패턴 발견 : 항상 0.8이 곱해진다.
      x1234..r
      P(X=x)0.20.8 X 0.2 = 0.160.8 X 0.8 X 0.2 = 0.1280.8 X 0.8 X 0.8 X 0.2 = 0.10240.8^(r-1)X0.2
  • 기하분포(Geometric Distribution) : 성공할 확률 p, 실패할 확률 q = 1 - p
    • r-1번 실패하고, 1번 성공 : P(X=r)=q(r1)pP(X=r) = q^{(r-1)}p
    • 기하분포의 최빈값을 1이다.(r = 1)
    • 첫 번째 성공을 위해 r보다 많은 수의 시행을 필요로 하는 경우
      • P(x>r)=qrP(x > r) = q^{r} = > r번의 시행이 모두 실패해야한다.
    • r과 같거나 적은 수의 시도가 필요한 경우
      • P(x<=r)=1qrP(x <= r) = 1-q^{r}
    • 성공 확률이 p일 때 변수 X가 기하분포를 따른다. X~Geo(P)
    • 기하분포의 기대치 : E(X)=1pE(X) = {1 \over p} (1을 성공확률로 나눈 값)
    • 기하분포의 분산 : Var(X)=qp2Var(X) = {q \over p^2} (실패 확률을 성공확률의 제곱으로 나눈 값)

◾이항 분포

  • 3문제, 보기 4개인 경우

    xP(X=x)power of 0.75power of 0.25
    00.75^3 = .42230
    13 x 0.75^2 x 0.25 = .42221
    23 x 0.75 x 0.25^2 = .14112
    30.25^3 = 0.01503
    • 3개의 질문에 대해 r개의 정답을 구하는 확률
      • P(X=r)=3Cr×0.25r×0.753rP(X = r) = 3Cr \times 0.25^{r} \times 0.75^{3-r}
  • 이항분포(Binomial Distribution) : 이산적 확률분포의 하나. 사건 일어나는 확률을 p, 일어나지 않을 확률 q 일 경우
    • P(X=r)=nCr×pr×qnrP(X=r) = nCr \times p^{r} \times q^{n-r}
    • X가 이항분포를 따를 때 p읠 확률일 때 n번의 시행인 경우 : X ~ B(n, p)
    • p가 0.5에 근접할 수록 이항분포 그래프는 좌우 대칭에 가까워진다.
    • n번 시행시
      • 기대값 : E(X)=E(X1)+E(X2)+..+E(Xn)=nE(X)=npE(X) = E(X_1) + E(X_2) + .. + E(X_n) = nE(X) = np
      • 분산 : Var(X)=Var(X1)+Var(X2)+...+Var(Xn)=nVar(X)=npqVar(X) = Var(X_1) + Var(X_2) + ... + Var(X_n) = nVar(X) = npq
  • 기하분포와 이항분포의 차이
    • 기하분포 : 성공을 거두기 위해 시행하는 시행의 횟수 에 관심. 변수 X는 첫번째 성공을 거두기 전까지 시도해야 하는 시행의 횟수(즉, 사건이 일어나기까지 시도해야 하는 시행의 횟수)
    • 이항분포 : 성공의 수 에 관심. n번의 시행에서 성공적인 결과를 얻는 수를 X라 할 때, r번의 성공이 있을 확률을 구하는 구하는 것

◾푸아송 분포

  • 푸아송 분포(Poisson Distribution) : 주어진 시간 내에 어떤 사건이 일어나는 횟수를 나타내는 이산확률분포
    • 개별적인 사건이 주어진 구간에 임의로 독립적으로 발생
    • 구간의 예 : 일주일 동안, 1km마다 등 시간과 공간
    • 발생하는 수의 평균값 : 람다( λ )
    • 주어진 구간에 사건이 발생하는 수 X, X가 구간마다 람다만큼 발생하는 푸아송 분포
      • X ~ Po(λ)
      • 특정 구간에 r번의 발생이 있을 확률 : P(X=r)=eλλrr!P(X=r) = {e^{-\lambda}\lambda ^{r} \over r!}
      • 기대값과 분산 : E(X)=λE(X) = \lambda, Var(X)=λVar(X) = \lambda
      • X ~ po(2)에서 3번 발생할 확률
        • P(X=3)=e2×233!=e2×86=e2×1.333=0.180P(X=3) = {e^{-2}\times 2 ^{3} \over 3!}={e^{-2}\times 8 \over 6} = e^{-2}\times 1.333 = 0.180
    • 푸아송 그래프에서는 람다가 커질수록 람다를 기준으로 좌우대칭이 생긴다.
  • 기계 고장 : 팝콘 기계가 고장을 일으키는 비율 3.4
    • 기계가 일정한 수 이상으로 고장나면 새로운 기계 구입
    • 오동작 비율을 알고, 오동작은 임의의 시점에서 발생
    • X ~ po(3.4)
    • 한 주동안 기계가 고장나지 않을 확률 : P(X=0)=e3.4×3.400!=e3.4×21=0.033P(X=0) = {e^{-3.4}\times 3.4 ^{0} \over 0!}={e^{-3.4}\times 2 \over 1} = 0.033
    • 한 주동안 기계가 3번 고장날 확률 : P(X=3)=e3.4×3.433!=e3.4×39.3046=0.0336.55=0.216P(X=3) = {e^{-3.4}\times 3.4 ^{3} \over 3!}={e^{-3.4}\times 39.304 \over 6} = 0.033 * 6.55 = 0.216
    • 기대값과 분산 : E(X)=λ=3.4E(X) = \lambda = 3.4, Var(X)=λ=3.4Var(X) = \lambda = 3.4
profile
후라이드 치킨

0개의 댓글