X에 대한 확률밀도함수(PDF)가 다음과 같이 주어진 경우, 구간 (a,b)에서의 균일확률변수라고 한다.
f(x)={b−a10if a<x<b
- 누적분포함수(CDF): F(x)=b−ax−a,a≤x≤b
- E[X]=∫abx⋅b−a1dx=2a+b,Var[X]=12(b−a)2
- 균일분포의 p번째 분위수 xp는 다음과 같다.
F(xp)=b−axp−a=p,xp=(1−p)a+pb
- Median의 경우 p=21, upper quartile의 경우 p=43이다.
지수분포(Exponential Distribution)
일정 시간 동안 발생하는 사건의 횟수가 포아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다. (기하분포의 연속형 version)
X가 빈도를 나타내는 모수 λ를 갖는 지수확률변수라고 할 때 확률밀도함수는 다음과 같다.
f(x)={λe−λx0if x≥0if x<0
- 누적분포함수(CDF): F(x)=∫0xλe−λudu=1−e−λx,x≥0
- P(X>s+t∣X>s)=e−λse−λ(t+s)=e−λt=P(X>t)
- 이 수식을 만족하는 성질을 무기억성이라고 한다. 이전까지 시행된 결과가 다음 시행에 영향을 주지 않는 것을 말하며, 기하분포와 유사하다.
- 적률생성함수
MX(t)=E[etx]=∫0∞etxλe−λxdx=t−λλ
- E[X]=∫0∞xλe−λxdx=λ1
- Var[X]=λ21
- 변동계수 (Coefficient of Variation): CV(X)=E[X]Var(X)=1
- 측정 단위가 다른 자료를 비교할 때 사용한다. 표준 편차가 같더라도 측정 단위(평균 등)가 다를 수 있으므로 사용한다.
- P-th quantile: F(xp)=1−e−λxp=p, xp=−λln(1−p)
감마분포(Gamma Distribution)
사건이 발생하는 시간 사이 간격은 서로 독립적이고 모수가 λ인 지수분포를 각각 따른다고 할 때, α번째 사건이 발생할 때까지 걸리는 시간은 감마분포를 따른다.
X가 모수 λ>0,α>0을 갖는 감마확률변수라고 할 때(X∼Γ(α,λ)), 다음을 만족한다.
f(x)={Γ(α)λe−λx(λx)α−10if x≥0if x<0
MX(t)=(1−λt)−α,t<λ
- 감마 함수는 다음과 같이 정의한다.
Γ(α)=∫0∞e−xxα−1dx=(α−1)! Factorial의 복소수 확장이라고 볼 수 있다.
- E[X]=λα
- Var[X]=λ2α
- CV(X)=α/λα/λ2=α1<1
지수, 포아송분포, 감마분포 간의 관계
처음 사건이 발생할 때까지의 대기시간은 지수분포를 따른다. 즉, 지수분포는 α=1인 감마분포이다.
α번째 도착까지의 대기시간은 감마분포를 따른다.
길이가 x인 구간에서의 도착 횟수 Y는 평균 μ=λx인 포아송분포를 따른다.
와이블분포(Weibull Distribution)
와이블 분포는 고장 및 대기시간을 모형화하는 데 자주 사용된다. 척도 모수 α>0와 형태 모수 β>0을 가지는 와이블 확률밀도함수는 다음과 같다.
f(x)=βαβxβ−1e−(αx)β
- 누적밀도함수: F(x)=1−e−(αx)β
- 형태 모수 β=1인 경우, 와이블 분포는 지수분포와 동일하다.
- E[X]=α1Γ(1+β1)
- Var[X]=α21(Γ(1+β2)−Γ(1+β1)2)
- xp=α(−ln(1−p))1/β
베타분포(Beta Distribution)
확률변수값 자체가 확률인 경우에 이에 대한 확률분포를 베타분포라고 한다. 베타분포는 형상 모수(성공 횟수) α와, 또다른 형상 모수(실패 횟수) β로 정의된다.
베타함수는 다음과 같다.
Beta(α,β)=∫01xα−1(1−x)β−1dx=Γ(α)⋅Γ(β)Γ(α+β)a>0,β>0
0≤x≤1 상태 공간을 가지고 있으며, 비율을 모형화할 때 사용된다. 베타분포의 확률밀도함수는 다음과 같다.
f(x)=Γ(α)⋅Γ(β)Γ(α+β)xα−1(1−x)β−1for 0≤x≤1
- E[X]=α+βα
- Var[X]=(α+β)2(α+β+1)αβ