노션 링크
Basic concept
Probability Space
- Sample space(표본공간) Ω: a (fixed) set of all possible outcomes
- event(사건) F: A set of events
- probability measure P:F→[0,1]
📐 공리
{Ai}⊆F에 대해
- 0≤P(Ai)≤1
- P(Ω)=1
- if i=j and Ai∩Aj=∅, P(∪iAi)=∑iP(Ai)
(Ω,F,P)를 probability space라 한다.
Basic properties of probability
A를 사건이라 하자.
- P(Ac)=1−P(A)
- If B가 사건이고B⊆A, P(B)≤P(A)
- 0=P(∅)≤P(A)≤P(Ω)=1
Other concepts
Boole’s inequality (Union bound)
Conditional probability
P(A∣B)=P(B)P(A∩B)
Bayes’ rule
P(A∣B)=P(B)P(B∣A)P(A)posterior=evidencelikelihood×prior
Random variable
A random variable on a probability space (Ω,F,P) is a function X:Ω→R
P(X=x)=P({ω∈Ω:X(ω)=x})
위에서 볼 수 있 듯 사건 X=x는 집합이다.
Types of random variables
- Discrete random variables (이산 확률 변수)
- probability mass function (PMF) p:X(Ω)→[0,1]
x∈X(Ω)∑p(x)=1P(X=x)=p(x)
- Continuous random variables (연속 확률 변수)
- probability density function (PDF) p:R→[0,∞)
∫−∞∞p(x)=1F(x)=∫−∞xp(z)dz
Joint probability
{Xi} are independent if for every finite subset of indices i1,…,jk∈I
p(Xi1,…,Xik)=j=1∏kp(Xij)
i.i.d
random variables are independent and identically distributed (i.i.d.)
p(X1,…,Xn)=i=1∏np(Xi)
where X1,…,Xn all share the same PMF/PDF
독립이고 서로 동일한 분포
CDF (cumulative distribution function)
FX(x)=P(X≤x)
Probability Distributions
각 기댓값과 분산은 급수/적분 계산을 하면 쉽게 구할 수 있다.
확률이 일정한 분포
Discrete
- X∼Unif(k,l)
- PX(x)={(l−k+1)1, x=k,k+1,⋯,l−1,l0, otherwise
- E[X]=(k+l)/2; Var[X]=(l−k)(l+k+2)/12
Continuous
- X∼Unif(a,b)
- PX(x)={(b−a)1, a≤x<b0, otherwise
- E[X]=(a+b)/2; Var[X]=(b−a)2/12

Bernoullo Distribution
랜덤한 이진 분포
- X∼Bern(p)
- PX(x)=⎩⎪⎪⎨⎪⎪⎧p,x=11−p,x=00,otherwise
- E[X]=p; Var[X]=p(1−p)
Geometric Distrubution
Bernoulli를 x회 시행할 때 첫번째(마지막)에만 성공할 확률
- X∼Geo(p)
- PX(x)=p(1−p)x−1 for x=1,2,3,⋯
- E[X]=1/p; Var[X]=p(1−p)
- ex)


Binomial Distribution
이항분포
- X∼B(p)
- PX(x)=(xn)px(1−p)x−1 for x=0,1,2,3,⋯,n
- E[X]=np; Var[X]=np(1−p)

Negative Binomial Distribution
음이항분포: r회의 실패를 하기 위한 성공 횟수
- X∼NB(p)
- PX(x)=(xx+r−1)px(1−p)r for x=0,1,2,3,⋯
- E[X]=rp(1−p); Var[X]=rp(1−p)2

Poisson Distribution
평균적으로 α회의 사건이 관찰되었을 때 실제로 x회일 확률 분포
- X∼Poi(p)
- PX(x)={axe−α/x!,x=0,1,2,⋯0,otherwise
- E[X]=α; Var[X]=α

n time slots에서 평균적으로 α회의 사건이 발생되었다. 그럼 각 slot에서 사건이 발생할 확률은 α/n이다. X를 실제 관찰된 사건의 횟수로 두면 X∼B(n,α/n)이다.
n→∞, B(n,α/n)→poi(α)

Exponential Distribution
단위시간동안 평균적으로 λ회의 사건이 발생할 때 사건까지 waiting time
- X∼Exp(λ)
- fX(x)=λe−λx for x≥0
- E[X]=λ1; Var[X]=λ21
K를 Pr[K=k]=Pr[k−1<X≤k]인 이산확률분포라 하자.
그럼 PK(k)=FX(k)−F(k−1)=(1−e−λ)(e−λ)k−1이므로 K∼Geo(1−e−λ)라 할 수 있다.
geometric distribition이 첫 성공을 위한 waiting time이라 할 수 있으므로 Exponential Distribution은 사건까지의 waiting time이라 할 수 있다.

Gaussian (Normal) Distribution
가우시안 (정규) 분포
- X∼N(μ,σ2)
- fX(x)=2πσ21e−2σ2(x−μ)2, FX(x)=Φ(σx−μ)
- E[X]=μ; Var[X]=σ2A
- 표준 정규 분포

- Central limit theorem
- Y=X1+X2+⋯+Xn이 i.i.d일 때 n→∞,Y→Normal distribution
- 실제 현상들은 작고 독립적인 사건들의 집합이므로 정규분포는 실제 적용에 중요하다.