연속형 확률분포

‍이세현·2025년 4월 14일
0

균일분포(Uniform Distribution)

XX에 대한 확률밀도함수(PDF)가 다음과 같이 주어진 경우, 구간 (a,b)(a,b)에서의 균일확률변수라고 한다.

f(x)={1baif a<x<b0f(x)=\begin{cases}\frac{1}{b-a} & \text{if } a<x<b \\ 0\end{cases}
  • 누적분포함수(CDF): F(x)=xaba,axbF(x)=\frac{x-a}{b-a}, \quad a\le x\le b
  • E[X]=abx1badx=a+b2,Var[X]=(ba)212E[X]=\int_a^bx\cdot\frac{1}{b-a}dx=\frac{a+b}{2}, \quad Var[X]=\frac{(b-a)^2}{12}
  • 균일분포의 pp번째 분위수 xpx_p는 다음과 같다.
    F(xp)=xpaba=p,xp=(1p)a+pbF(x_p)=\frac{x_p-a}{b-a}=p, \quad x_p=(1-p)a+pb
    • Median의 경우 p=12p=\frac{1}{2}, upper quartile의 경우 p=34p=\frac{3}{4}이다.

지수분포(Exponential Distribution)

일정 시간 동안 발생하는 사건의 횟수가 포아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다. (기하분포의 연속형 version)
XX가 빈도를 나타내는 모수 λ\lambda를 갖는 지수확률변수라고 할 때 확률밀도함수는 다음과 같다.

f(x)={λeλxif x00if x<0f(x)=\begin{cases}\lambda e^{-\lambda x} & \text{if }x\ge0 \\ 0 & \text{if } x<0\end{cases}
  • 누적분포함수(CDF): F(x)=0xλeλudu=1eλx,x0F(x)=\int_0^x\lambda e^{-\lambda u}du=1-e^{-\lambda x}, \quad x\ge0
  • P(X>s+tX>s)=eλ(t+s)eλs=eλt=P(X>t)P(X>s+t|X>s)=\frac{e^{-\lambda(t+s)}}{e^{-\lambda s}}=e^{-\lambda t}=P(X>t)
    • 이 수식을 만족하는 성질을 무기억성이라고 한다. 이전까지 시행된 결과가 다음 시행에 영향을 주지 않는 것을 말하며, 기하분포와 유사하다.
  • 적률생성함수
    MX(t)=E[etx]=0etxλeλxdx=λtλM_X(t)=E[e^{tx}]=\int_0^\infin e^{tx} \lambda e^{-\lambda x}dx=\frac{\lambda}{t-\lambda}
  • E[X]=0xλeλxdx=1λE[X]=\int_0^{\infin}x\lambda e^{-\lambda x}dx=\frac{1}{\lambda}
  • Var[X]=1λ2Var[X]=\frac{1}{\lambda^2}
  • 변동계수 (Coefficient of Variation): CV(X)=Var(X)E[X]=1CV(X)=\frac{\sqrt{Var(X)}}{E[X]}=1
    • 측정 단위가 다른 자료를 비교할 때 사용한다. 표준 편차가 같더라도 측정 단위(평균 등)가 다를 수 있으므로 사용한다.
  • P-th quantile: F(xp)=1eλxp=pF(x_p)=1-e^{-\lambda x_p}=p, xp=ln(1p)λx_p=-\frac{\ln(1-p)}{\lambda}

감마분포(Gamma Distribution)

사건이 발생하는 시간 사이 간격은 서로 독립적이고 모수가 λ\lambda인 지수분포를 각각 따른다고 할 때, α\alpha번째 사건이 발생할 때까지 걸리는 시간은 감마분포를 따른다.
XX가 모수 λ>0,α>0\lambda>0, \quad \alpha>0을 갖는 감마확률변수라고 할 때(XΓ(α,λ))(X\sim\Gamma(\alpha,\lambda)), 다음을 만족한다.

f(x)={λeλx(λx)α1Γ(α)if x00if x<0f(x)=\begin{cases}\frac{\lambda e^{-\lambda x}(\lambda x)^{\alpha -1}}{\Gamma(\alpha)} & \text{if }x\ge0 \\ 0 & \text{if }x<0 \end{cases}
MX(t)=(1tλ)α,t<λM_X(t)=(1-\frac{t}{\lambda})^{-\alpha}, \quad t<\lambda
  • 감마 함수는 다음과 같이 정의한다.
    Γ(α)=0exxα1dx=(α1)!\Gamma(\alpha)=\int_0^{\infin}e^{-x}x^{\alpha-1}dx=(\alpha-1)!
    Factorial의 복소수 확장이라고 볼 수 있다.
  • E[X]=αλE[X]=\frac{\alpha}{\lambda}
  • Var[X]=αλ2Var[X]=\frac{\alpha}{\lambda^2}
  • CV(X)=α/λ2α/λ=1α<1CV(X)=\frac{\sqrt{\alpha/\lambda^2}}{\alpha/\lambda}=\frac{1}{\sqrt{\alpha}}<1

지수, 포아송분포, 감마분포 간의 관계

처음 사건이 발생할 때까지의 대기시간은 지수분포를 따른다. 즉, 지수분포는 α=1\alpha=1인 감마분포이다.
α\alpha번째 도착까지의 대기시간은 감마분포를 따른다.
길이가 xx인 구간에서의 도착 횟수 YY는 평균 μ=λx\mu=\lambda x인 포아송분포를 따른다.

와이블분포(Weibull Distribution)

와이블 분포는 고장 및 대기시간을 모형화하는 데 자주 사용된다. 척도 모수 α>0\alpha>0와 형태 모수 β>0\beta>0을 가지는 와이블 확률밀도함수는 다음과 같다.

f(x)=βαβxβ1e(αx)βf(x)=\beta\alpha^\beta x^{\beta-1}e^{-(\alpha x)^\beta}
  • 누적밀도함수: F(x)=1e(αx)βF(x)=1-e^{-(\alpha x)^\beta}
  • 형태 모수 β=1\beta=1인 경우, 와이블 분포는 지수분포와 동일하다.
  • E[X]=1αΓ(1+1β)E[X]=\frac{1}{\alpha}\Gamma(1+\frac{1}{\beta})
  • Var[X]=1α2(Γ(1+2β)Γ(1+1β)2)Var[X]=\frac{1}{\alpha^2}\Big(\Gamma(1+\frac{2}\beta)-\Gamma(1+\frac{1}{\beta})^2\Big)
  • xp=(ln(1p))1/βαx_p=\frac{(-\ln(1-p))^{1/\beta}}{\alpha}

베타분포(Beta Distribution)

확률변수값 자체가 확률인 경우에 이에 대한 확률분포를 베타분포라고 한다. 베타분포는 형상 모수(성공 횟수) α\alpha와, 또다른 형상 모수(실패 횟수) β\beta로 정의된다.
베타함수는 다음과 같다.

Beta(α,β)=01xα1(1x)β1dx=Γ(α+β)Γ(α)Γ(β)a>0,β>0Beta(\alpha,\beta)=\int_0^1x^{\alpha-1}(1-x)^{\beta-1}dx=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\cdot\Gamma(\beta)}\quad a>0,\beta>0

0x10\le x\le1 상태 공간을 가지고 있으며, 비율을 모형화할 때 사용된다. 베타분포의 확률밀도함수는 다음과 같다.

f(x)=Γ(α+β)Γ(α)Γ(β)xα1(1x)β1for 0x1f(x)=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\cdot\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1} \quad \text{for } 0\le x\le1
  • E[X]=αα+βE[X]=\frac{\alpha}{\alpha+\beta}
  • Var[X]=αβ(α+β)2(α+β+1)Var[X]=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}
profile
Hi, there 👋

0개의 댓글