확률과 통계 정리

유승우·2023년 9월 26일

노션 링크

Basic concept

Probability Space

  • Sample space(표본공간) Ω\Omega: a (fixed) set of all possible outcomes
  • event(사건) F\mathcal F: A set of events
  • probability measure P:F[0,1]\mathbb P:\mathcal F \rightarrow[0,1]
📐 공리

{Ai}F\{A_i\}\subseteq\mathcal F에 대해

  1. 0P(Ai)10 \le P(A_i)\le1
  2. P(Ω)=1\mathbb P(\Omega)=1
  3. if ij and AiAj=, P(iAi)=iP(Ai)if\ i\ne j\ and\ A_i\cap A_j=\emptyset,\ \mathbb P(\cup_iA_i)=\sum_i\mathbb P(A_i)

(Ω,F,P)(\Omega, \mathcal F, \mathbb P)를 probability space라 한다.

Basic properties of probability

AA를 사건이라 하자.

  1. P(Ac)=1P(A)\mathbb P(A^c) = 1-\mathbb P(A)
  2. If BB가 사건이고BA, P(B)P(A)B\subseteq A,\ \mathbb P(B)\le \mathbb P(A)
  3. 0=P()P(A)P(Ω)=10=\mathbb P(\emptyset)\le\mathbb P(A)\le\mathbb P(\Omega)=1

Other concepts

Boole’s inequality (Union bound)

Conditional probability

P(AB)=P(AB)P(B)\mathbb P(A|B)={\mathbb P(A\cap B)\over \mathbb P(B)}

Bayes’ rule

P(AB)=P(BA)P(A)P(B)posterior=likelihood×priorevidence\mathbb P(A|B)={\mathbb P(B|A)\mathbb P(A)\over\mathbb P(B)}\\ posterior={likelihood\times prior\over evidence}

Random variable

A random variable on a probability space (Ω,F,P)(\Omega, \mathcal F, \mathbb P) is a function X:ΩRX: \Omega\rightarrow \mathbb R

P(X=x)=P({ωΩ:X(ω)=x})\mathbb P(X=x)=\mathbb P(\{\omega\in\Omega:X(\omega)=x\})

위에서 볼 수 있 듯 사건 X=xX=x는 집합이다.

Types of random variables

  • Discrete random variables (이산 확률 변수)
    • probability mass function (PMF) p:X(Ω)[0,1]p:X(\Omega)\rightarrow[0,1]
      xX(Ω)p(x)=1P(X=x)=p(x)\sum_{x\in X(\Omega)}p(x)=1\quad \mathbb P(X=x)=p(x)
  • Continuous random variables (연속 확률 변수)
    • probability density function (PDF) p:R[0,)p: \mathbb R\rightarrow [0,\infin)
      p(x)=1F(x)=xp(z)dz\int_{-\infin}^\infin p(x)=1\quad F(x)=\int_{-\infin}^x p(z)dz

Joint probability

{Xi}\{X_i\} are independent if for every finite subset of indices i1,,jkIi_1,\dots,j_k\in I

p(Xi1,,Xik)=j=1kp(Xij)p(X_{i_1},\dots,X_{i_k})=\prod_{j=1}^kp(X_{i_j})

i.i.d

random variables are independent and identically distributed (i.i.d.)

p(X1,,Xn)=i=1np(Xi)p(X_1,\dots,X_n)=\prod_{i=1}^np(X_i)

where X1,,XnX_1,\dots,X_n all share the same PMF/PDF

독립이고 서로 동일한 분포

CDF (cumulative distribution function)

FX(x)=P(Xx)F_X(x)=\mathbb P(X\le x)

Probability Distributions

각 기댓값과 분산은 급수/적분 계산을 하면 쉽게 구할 수 있다.

Uniform Distrbution

확률이 일정한 분포

Discrete

  • XUnif(k,l)X\sim Unif(k,l)
  • PX(x)={1(lk+1), x=k,k+1,,l1,l0, otherwiseP_X(x) = \begin{cases} {1\over(l-k+1)},\ x=k,k+1,\cdots,l-1,l \\ 0,\ otherwise \end{cases}
  • E[X]=(k+l)/2; Var[X]=(lk)(l+k+2)/12\mathbb E[X] = {(k+l)/2};\ Var[X]=(l-k)(l+k+2)/12

Continuous

  • XUnif(a,b)X\sim Unif(a,b)
  • PX(x)={1(ba), ax<b0, otherwiseP_X(x) = \begin{cases} {1\over(b-a)},\ a\le x<b \\ 0,\ otherwise \end{cases}
  • E[X]=(a+b)/2; Var[X]=(ba)2/12\mathbb E[X] = {(a+b)/2};\ Var[X]=(b-a)^2/12

Untitled

Bernoullo Distribution

랜덤한 이진 분포

  • XBern(p)X\sim Bern(p)
  • PX(x)={p,x=11p,x=00,otherwiseP_X(x) = \begin{cases} p,\quad x=1\\ 1-p,\quad x=0\\ 0,\quad otherwise \end{cases}
  • E[X]=p; Var[X]=p(1p)\mathbb E[X] = p;\ Var[X]=p(1-p)

Geometric Distrubution

Bernoulli를 x회 시행할 때 첫번째(마지막)에만 성공할 확률

  • XGeo(p)X\sim Geo(p)
  • PX(x)=p(1p)x1 for x=1,2,3,P_X(x) = p(1-p)^{x-1}\ for\ x=1,2,3,\cdots
  • E[X]=1/p; Var[X]=p(1p)\mathbb E[X] = 1/p;\ Var[X]=p(1-p)
  • ex) Untitled

Untitled

Binomial Distribution

이항분포

  • XB(p)X\sim B(p)
  • PX(x)=(nx)px(1p)x1 for x=0,1,2,3,,nP_X(x) = \binom{n}{x}p^x(1-p)^{x-1}\ for\ x=0,1,2,3,\cdots,n
  • E[X]=np; Var[X]=np(1p)\mathbb E[X] = np;\ Var[X]=np(1-p)

Untitled

Negative Binomial Distribution

음이항분포: r회의 실패를 하기 위한 성공 횟수

  • XNB(p)X\sim NB(p)
  • PX(x)=(x+r1x)px(1p)r for x=0,1,2,3,P_X(x) = \binom{x+r-1}{x}p^x(1-p)^r\ for\ x=0,1,2,3,\cdots
  • E[X]=rp(1p); Var[X]=rp(1p)2\mathbb E[X] = rp(1-p);\ Var[X]=rp(1-p)^2

Untitled

Poisson Distribution

평균적으로 α\alpha회의 사건이 관찰되었을 때 실제로 x회일 확률 분포

  • XPoi(p)X\sim Poi(p)
  • PX(x)={axeα/x!,x=0,1,2,0,otherwiseP_X(x) = \begin{cases} a^xe^{-\alpha}/x!,\quad x=0,1,2,\cdots\\ 0,\quad otherwise \end{cases}
  • E[X]=α; Var[X]=α\mathbb E[X] = \alpha;\ Var[X]=\alpha

Untitled

n time slots에서 평균적으로 α\alpha회의 사건이 발생되었다. 그럼 각 slot에서 사건이 발생할 확률은 α/n\alpha /n이다. XX를 실제 관찰된 사건의 횟수로 두면 XB(n,α/n)X\sim B(n,\alpha/n)이다.

n, B(n,α/n)poi(α)n\rightarrow \infin,\ B(n,\alpha/n)\rightarrow poi(\alpha)

Untitled

Exponential Distribution

단위시간동안 평균적으로 λ\lambda회의 사건이 발생할 때 사건까지 waiting time

  • XExp(λ)X\sim Exp(\lambda)
  • fX(x)=λeλx for x0f_X(x) = \lambda e^{-\lambda x}\ for\ x\ge0
  • E[X]=1λ; Var[X]=1λ2\mathbb E[X] = {1\over \lambda};\ Var[X]={1\over \lambda^2}

KKPr[K=k]=Pr[k1<Xk]Pr[K=k]=Pr[k-1<X\le k]인 이산확률분포라 하자.

그럼 PK(k)=FX(k)F(k1)=(1eλ)(eλ)k1P_K(k) = F_X(k)-F(k-1)=(1-e^{-\lambda})(e^{-\lambda})^{k-1}이므로 KGeo(1eλ)K\sim Geo(1-e^{-\lambda})라 할 수 있다.

geometric distribition이 첫 성공을 위한 waiting time이라 할 수 있으므로 Exponential Distribution은 사건까지의 waiting time이라 할 수 있다.

Untitled

Gaussian (Normal) Distribution

가우시안 (정규) 분포

  • XN(μ,σ2)X\sim N(\mu,\sigma^2)
  • fX(x)=12πσ2e(xμ)22σ2, FX(x)=Φ(xμσ)f_X(x) = {1\over\sqrt{2\pi\sigma^2}}e^{-{(x-\mu)^2\over2\sigma^2}},\ F_X(x)=\Phi({x-\mu\over\sigma})
  • E[X]=μ; Var[X]=σ2\mathbb E[X] = \mu;\ Var[X]=\sigma^2A
  • 표준 정규 분포 Untitled Untitled
  • Central limit theorem
    • Y=X1+X2++XnY=X_1+X_2+\cdots+X_n이 i.i.d일 때 n,YNormal distributionn\rightarrow \infin, Y\rightarrow Normal\ distribution
    • 실제 현상들은 작고 독립적인 사건들의 집합이므로 정규분포는 실제 적용에 중요하다.
profile
ㅎㅇㄹ

0개의 댓글