[Distribution] Continuous Distribution

김협·2024년 7월 17일

Distribution

목록 보기
2/3

Continuous Distribution

정규 분포 (Normal Distribution)

정규 분포는 통계학에서 가장 중요한 분포 중 하나

평균 μ\mu, 분산 σ2\sigma^2으로 정의되는 확률 분포

확률 밀도 함수(PDF):

f(x)=12πσ2exp((xμ)22σ2),for  <x<f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), \quad \text{for} \ \ -\infin<x<\infin
  • 평균 (Mean): μ\mu
  • 분산 (Variance): σ2\sigma^2

특성:

  • Symmetric
  • CLT와 관련

t 분포 (t-Distribution)

t 분포는 정규 분포에서 parameter estimation할 때 사용되며, 표본 크기가 작을 때 특히 유용

  • 정의: t 분포는 표본 평균과 표준편차의 비율에 따른 분포로, 자유도에 의해 결정

확률 밀도 함수(PDF):

f(x)=Γ(ν+12)νπΓ(ν2)(1+x2ν)ν+12,for  <x<f(x) = \frac{\Gamma\left(\frac{\nu + 1}{2}\right)}{\sqrt{\nu \pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{x^2}{\nu}\right)^{-\frac{\nu + 1}{2}}, \quad \text{for} \ \ -\infin<x<\infin

여기서 ν\nu는 degree of freedom.

  • 평균 (Mean): 0 (자유도가 1보다 클 때)
  • 분산 (Variance): νν2\frac{\nu}{\nu - 2} (자유도가 2보다 클 때)

특성:

  • 정규 분포와 유사하지만 꼬리가 두꺼움,
  • 자유도가 증가할수록 정규 분포에 수렴

카이제곱 분포 (Chi-Square Distribution)

카이제곱 분포는 정규 분포를 따르는 독립된 제곱들의 합

  • 독립된 제곱의 합 개수를 kk라고 하면, degree of freedom이 kk인 카이제곱 분포.

확률 밀도 함수(PDF):

f(x;k)=12k/2Γ(k/2)x(k/2)1ex/2,for  0x<f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{(k/2) - 1} e^{-x/2}, \quad \text{for} \ \ 0 \leq x<\infin
  • 평균 (Mean): kk (자유도)
  • 분산 (Variance): 2k2k

특성:

  • Non-symmetric
  • 자유도가 클수록 정규 분포에 가까워짐

F 분포 (F-Distribution)

F 분포는 두 독립적인 카이제곱 분포의 비율

  • 분산 분석에서 사용

확률 밀도 함수(PDF):

f(x;d1,d2)=(d1d2)d1/2xd1/21B(d12,d22)(1+d1xd2)(d1+d2)/2,for  0x<f(x; d_1, d_2) = \frac{\left(\frac{d_1}{d_2}\right)^{d_1/2} x^{d_1/2 - 1}}{B\left(\frac{d_1}{2}, \frac{d_2}{2}\right)} \left(1 + \frac{d_1 x}{d_2}\right)^{-(d_1 + d_2)/2}, \quad \text{for} \ \ 0 \leq x<\infin

여기서 d1d_1d2d_2는 degree of freedom

  • 평균 (Mean): d2d22\frac{d_2}{d_2 - 2} (자유도 d2>2d_2 > 2일 때)
  • 분산 (Variance): 2d22(d1+d22)d1(d22)2(d24)\frac{2d_2^2 (d_1 + d_2 - 2)}{d_1(d_2 - 2)^2(d_2 - 4)} (자유도 d2>4d_2 > 4일 때)

특성:

  • Non-symmetric
  • 자유도가 클수록 카이제곱 분포에 가까워짐

베타 분포 (Beta Distribution)

베타 분포는 [0, 1] 구간에서 정의된 연속 확률 분포로, 주로 베이즈 통계에서 사용

두 shape parameter α\alphaβ\beta에 의해 정의되는 연속 분포

확률 밀도 함수(PDF):

f(x;α,β)=xα1(1x)β1B(α,β),for  0x<1f(x; \alpha, \beta) = \frac{x^{\alpha - 1} (1 - x)^{\beta - 1}}{B(\alpha, \beta)}, \quad \text{for} \ \ 0\leq x<1

where B(α,β)Γ(α)Γ(β)Γ(α+β)\text{B}(\alpha, \beta) \frac{\Gamma(\alpha) \Gamma(\beta)}{\Gamma(\alpha +\beta)}

  • 평균 (Mean): αα+β\frac{\alpha}{\alpha + \beta}
  • 분산 (Variance): αβ(α+β)2(α+β+1)\frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)}

특성:

  • 모수에 따라 다양한 형태를 가짐
  • 베이즈 추론에서 prior distn으로 주로 사용

감마 분포 (Gamma Distribution)

감마 분포는 연속 확률 분포로, 포아송 과정에서 사건이 발생하는 시간 간격을 모델링

두 parameter α\alphaβ\beta에 의해 정의되는 분포

  • α\alpha: shape parameter
  • β\beta: rate parameter

확률 밀도 함수(PDF):

f(x;α,β)=βαxα1eβxΓ(α),for  0x<f(x; \alpha, \beta) = \frac{\beta^\alpha x^{\alpha - 1} e^{-\beta x}}{\Gamma(\alpha)} , \quad \text{for} \ \ 0\leq x<\infin
  • 평균 (Mean): αβ\frac{\alpha}{\beta}
  • 분산 (Variance): αβ2\frac{\alpha}{\beta^2}

특성:

  • 지수 분포와 관련
    • α=1\alpha = 1일 때 지수 분포가 된다.

균등 분포 (Uniform Distribution)

균등 분포는 특정 구간 내에서 모든 값이 동일한 확률을 가지는 분포

확률 밀도 함수(PDF)

f(x)={1baif axb0otherwisef(x) = \begin{cases} \frac{1}{b - a} & \text{if } a \le x \le b \\ 0 & \text{otherwise} \end{cases}
  • 평균 (Mean): a+b2\frac{a + b}{2}
  • 분산 (Variance): (ba)212\frac{(b - a)^2}{12}

특성:

  • 일정한 확률 밀도
  • 평균과 분산이 구간의 중간 값에 비례

코시 분포 (Cauchy Distribution)

코시 분포는 정규 분포와 비슷하지만, 평균과 분산이 정의되지 않는 분포

위치 모수 x0x_0와 척도 모수 γ\gamma에 의해 정의

확률 밀도 함수(PDF):

f(x;x0,γ)=1πγ[1+(xx0γ)2],for  x<f(x; x_0, \gamma) = \frac{1}{\pi \gamma \left[1 + \left(\frac{x - x_0}{\gamma}\right)^2\right]} , \quad \text{for} \ \ -\infin\leq x<\infin
  • 평균 (Mean): 정의되지 않음
  • 분산 (Variance): 정의되지 않음

특성:

  • 두꺼운 꼬리를 가져 평균과 분산이 존재하지 않음

분포 간의 연관성

  • 정규 분포와 t 분포: t 분포는 표본 크기가 커질수록 정규 분포에 수렴
  • 정규 분포와 카이제곱 분포: 정규 분포를 따르는 변수의 제곱합이 카이제곱 분포를 따름
  • 카이제곱 분포와 F 분포: F 분포는 두 카이제곱 분포의 비율로 정의
  • 베타 분포와 감마 분포: 베타 분포는 두 감마 분포를 이용해 정의할 수 있음
  • 균등 분포와 다른 분포: 균등 분포는 랜덤 변수 생성의 기본 분포로 사용
  • 코시 분포와 정규 분포: 코시 분포는 정규 분포와 형태가 유사하지만, 꼬리가 두꺼워 평균과 분산이 정의되지 않음
profile
예리하되 유연하게

0개의 댓글