Continuous Distribution
정규 분포 (Normal Distribution)
정규 분포는 통계학에서 가장 중요한 분포 중 하나
평균 μ, 분산 σ2으로 정의되는 확률 분포
확률 밀도 함수(PDF):
f(x)=2πσ21exp(−2σ2(x−μ)2),for −∞<x<∞
- 평균 (Mean): μ
- 분산 (Variance): σ2
특성:
t 분포 (t-Distribution)
t 분포는 정규 분포에서 parameter estimation할 때 사용되며, 표본 크기가 작을 때 특히 유용
- 정의: t 분포는 표본 평균과 표준편차의 비율에 따른 분포로, 자유도에 의해 결정
확률 밀도 함수(PDF):
f(x)=νπΓ(2ν)Γ(2ν+1)(1+νx2)−2ν+1,for −∞<x<∞
여기서 ν는 degree of freedom.
- 평균 (Mean): 0 (자유도가 1보다 클 때)
- 분산 (Variance): ν−2ν (자유도가 2보다 클 때)
특성:
- 정규 분포와 유사하지만 꼬리가 두꺼움,
- 자유도가 증가할수록 정규 분포에 수렴
카이제곱 분포 (Chi-Square Distribution)
카이제곱 분포는 정규 분포를 따르는 독립된 제곱들의 합
- 독립된 제곱의 합 개수를 k라고 하면, degree of freedom이 k인 카이제곱 분포.
확률 밀도 함수(PDF):
f(x;k)=2k/2Γ(k/2)1x(k/2)−1e−x/2,for 0≤x<∞
- 평균 (Mean): k (자유도)
- 분산 (Variance): 2k
특성:
- Non-symmetric
- 자유도가 클수록 정규 분포에 가까워짐
F 분포 (F-Distribution)
F 분포는 두 독립적인 카이제곱 분포의 비율
확률 밀도 함수(PDF):
f(x;d1,d2)=B(2d1,2d2)(d2d1)d1/2xd1/2−1(1+d2d1x)−(d1+d2)/2,for 0≤x<∞
여기서 d1과 d2는 degree of freedom
- 평균 (Mean): d2−2d2 (자유도 d2>2일 때)
- 분산 (Variance): d1(d2−2)2(d2−4)2d22(d1+d2−2) (자유도 d2>4일 때)
특성:
- Non-symmetric
- 자유도가 클수록 카이제곱 분포에 가까워짐
베타 분포 (Beta Distribution)
베타 분포는 [0, 1] 구간에서 정의된 연속 확률 분포로, 주로 베이즈 통계에서 사용
두 shape parameter α와 β에 의해 정의되는 연속 분포
확률 밀도 함수(PDF):
f(x;α,β)=B(α,β)xα−1(1−x)β−1,for 0≤x<1
where B(α,β)Γ(α+β)Γ(α)Γ(β)
- 평균 (Mean): α+βα
- 분산 (Variance): (α+β)2(α+β+1)αβ
특성:
- 모수에 따라 다양한 형태를 가짐
- 베이즈 추론에서 prior distn으로 주로 사용
감마 분포 (Gamma Distribution)
감마 분포는 연속 확률 분포로, 포아송 과정에서 사건이 발생하는 시간 간격을 모델링
두 parameter α와 β에 의해 정의되는 분포
- α: shape parameter
- β: rate parameter
확률 밀도 함수(PDF):
f(x;α,β)=Γ(α)βαxα−1e−βx,for 0≤x<∞
- 평균 (Mean): βα
- 분산 (Variance): β2α
특성:
- 지수 분포와 관련
- α=1일 때 지수 분포가 된다.
균등 분포는 특정 구간 내에서 모든 값이 동일한 확률을 가지는 분포
확률 밀도 함수(PDF)
f(x)={b−a10if a≤x≤botherwise
- 평균 (Mean): 2a+b
- 분산 (Variance): 12(b−a)2
특성:
- 일정한 확률 밀도
- 평균과 분산이 구간의 중간 값에 비례
코시 분포 (Cauchy Distribution)
코시 분포는 정규 분포와 비슷하지만, 평균과 분산이 정의되지 않는 분포
위치 모수 x0와 척도 모수 γ에 의해 정의
확률 밀도 함수(PDF):
f(x;x0,γ)=πγ[1+(γx−x0)2]1,for −∞≤x<∞
- 평균 (Mean): 정의되지 않음
- 분산 (Variance): 정의되지 않음
특성:
- 두꺼운 꼬리를 가져 평균과 분산이 존재하지 않음
분포 간의 연관성
- 정규 분포와 t 분포: t 분포는 표본 크기가 커질수록 정규 분포에 수렴
- 정규 분포와 카이제곱 분포: 정규 분포를 따르는 변수의 제곱합이 카이제곱 분포를 따름
- 카이제곱 분포와 F 분포: F 분포는 두 카이제곱 분포의 비율로 정의
- 베타 분포와 감마 분포: 베타 분포는 두 감마 분포를 이용해 정의할 수 있음
- 균등 분포와 다른 분포: 균등 분포는 랜덤 변수 생성의 기본 분포로 사용
- 코시 분포와 정규 분포: 코시 분포는 정규 분포와 형태가 유사하지만, 꼬리가 두꺼워 평균과 분산이 정의되지 않음