DS School Week 9-4 통계 : 연속 확률 분포
오늘 학습 계획
학습 내용
1. 연속 확률 분포 기초
- 확률 밀도 함수(PDF)
- 정의
- 모든 X에 대해서 f(x)≥0
- P(X∈(−∞,∞))=∫−∞∞f(x)dx=1
- P(a≤X≤b)=∫abf(x)dx
- 성질
- P(X=a)=P(a≤X≤a)=∫aaf(x)dx=0
- P(a≤X≤b)=P(a≤X<a)=P(a<X≤a)=P(a<X<a)
- E(X)=∫−∞∞xf(x)dx
Var(X)=E(X−μ)2=∫−∞∞(x−μ)2f(x)dx
- 누적 분포 함수(CDF)
- 확률 밀도 함수를 적분하면 됨
- F(X)=P[X≤x]=∫−∞xf(x)dt
- 성질
- 0≤F(X)≤1
- b≥a면, F(b)≥F(a)
- F(b)−F(a)=P[a≤X≤b]
2.균일 분포
- f(x)={b−a1,a≤x≤b0,otherwise
- f(x)=⎩⎪⎪⎨⎪⎪⎧0,x≤ab−a1,a≤x≤b1,x≥b
- E[X]=∫abxf(x)dx=∫abxb−a1dx=[b−a121x2]ab=2(b−a)b2−a2=2b+a
E[X2]=∫abx2b−a1dx=3b2+ab+a2
Var[X]=E[X2]−(E[X])2=3b2+ab+a2−(2b+a)2=12(b−a)2
3. 정규 분포
- f(x)=2πσ1e−2σ21(x−μ)2,−∞<x<∞
X∼N(μ,σ2)
- 엑셀 : norm.dist(x, μ, σ)
- 표준 정규 분포
- X∼N(μ,σ2)일 때,
Z=σX−μ⟹Z∼N(0,1)
- ϕ(z)=2π1e−21x2
- 정규 분포의 성질
- X∼N(μ,σ2)일 때, aX+b∼N(aμ+b,a2σ2)
- X∼(μ1,σ12),Y∼N(μ2,σ22)이고 X와 Y가 독립일 때
aX+bY∼N(aμ1+bμ2,a2σ12+b2σ22.)
- 이항 분포의 정규 근사
- X∼B(n,p)일 때, 확률변수 X는 n이 충분히 크면 근사적으로 정규 분포 X∼N(np,np(1−p))를 따름
- Z=np(1−p)X−np∼N(0,1)
4. 지수 분포
- 단위 시간당 발생할 확률이 lambda인 어떤 사건의 횟수가 포아송 분포를 따를 때, 어떤 사건이 처음 발생할 때 가지 걸린 시간 확률 변수 X
- X∼Exp(λ)
f(x)=λe−λx,x≥0
→ CDF : F(x)=1−e−λx,x≥0
- E[X]=λ1
Var[X]=λ21
- 지수 분포의 무기억성
- 어떤 시점부터 소요되는 시간은, 과거 시간에 영향을 받지 않음
- P(X>a+t∣X>a)=P(X>t)
※ 확률 분포의 관계
다음 학습 계획