[Distribution] 베르누이 / 이항 / 다항 분포

김협·2024년 7월 17일

Distribution

목록 보기
1/3

Discrete Distribution

Discrete probability distribution 중 자주 만나게 되는 3가지 분포에 대해서 설명하는 글이다.

  • Poission distribution은 다른 게시글에서 exponential distribution과 함께 다룰 예정.

베르누이 분포 (Bernoulli Distribution)

한 번의 시행에서 두 가지 결과(성공과 실패) 중 하나만 나올 수 있는 경우를 모델링하는 확률 분포

  • 정의: 베르누이 시행은 성공 확률 pp와 실패 확률 1p1-p를 가지는 단일 시행입니다.

확률 질량 함수(PMF):

P(X=x)={pif x=11pif x=0P(X = x) = \begin{cases} p & \text{if } x = 1 \\ 1 - p & \text{if } x = 0 \end{cases}

여기서 XX는 베르누이 확률 변수로, X=1X = 1은 성공, X=0X = 0 은 실패

  • 기대값(Mean): E[X]=p\mathbb{E}[X] = p
  • 분산(Variance): Var(X)=p(1p)\text{Var}(X) = p(1 - p)

이항 분포 (Binomial Distribution)

독립적이고 동일한 베르누이 시행을 nn번 반복했을 때 성공 횟수에 대한 분포

  • i.e., 여러 번의 베르누이 시행의 합으로 이해할 수 있습니다.
  • 정의: 각 시행이 성공할 확률이 pp인 베르누이 시행을 nn번 반복하여 성공한 횟수를 모델링하는 분포

확률 질량 함수(PMF):

P(X=x)=(nx)px(1p)nx,for  x=0,1,...,nP(X = x) = \binom{n}{x} p^x (1 - p)^{n - x},\quad \text{for}\ \ x=0,1,...,n
  • 기대값(Mean): E[X]=np\mathbb{E}[X] = np
  • 분산(Variance): Var(X)=np(1p)\text{Var}(X) = np(1 - p)

다항 분포 (Multinomial Distribution)

다항 분포는 이항 분포를 확장하여, 각 시행에서 결과가 여러 가지 범주 중 하나로 나타나는 경우를 모델링

  • 즉, 1 또는 0 뿐이었던 이항분포의 범주가 확장된 형태

각 범주는 특정 확률을 가지며, 여러 번의 시행을 통해 각 범주에 해당하는 횟수를 모델링

  • 정의: kk개의 범주로 나누어진 시행을 nn번 반복했을 때, 각 범주에 해당하는 횟수를 모델링하는 분포

확률 질량 함수(PMF):

P(X1=x1,X2=x2,,Xk=xk)=n!x1!x2!xk!p1x1p2x2pkxkP(X_1 = x_1, X_2 = x_2, \ldots, X_k = x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k}

여기서 i=1kxi=n\sum_{i=1}^k x_i = n이고, 각 pip_i는 범주 ii에 대한 확률로 i=1kpi=1\sum_{i=1}^k p_i = 1.

  • 또한 0xin0 \leq x_i \leq n
  • 기대값(Mean): E[Xi]=npifor  i=1,2,,k\mathbb{E}[X_i] = np_i \quad\text{for} \ \ i = 1, 2, \ldots, k
  • 분산(Variance): Var(Xi)=npi(1pi)\text{Var}(X_i) = np_i (1 - p_i)
  • 공분산(Covariance): Cov(Xi,Xj)=npipjfor  ij\text{Cov}(X_i, X_j) = -np_i p_j \quad \text{for} \ \ i \neq j
profile
예리하되 유연하게

0개의 댓글