정규 분포
정규 분포는 중심 극한 정리와 가설 검정에서 중요한 역할을 하는 통계학의 핵심적인 확률 분포다. 정규 분포의 성질을 도출할 때는 표준정규분포를 이용해 도출하는 경우가 많다.
Z∼N(0,1)fZ(z)=2π1e2−z2MZ(t)=e2t2
표준정규분포를 이용해 일반적인 기댓값이 μ이고 분산이 σ2인 정규분포를 도출해보자.
X=σZ+μFX(x)=P(X≤x)=P(σZ+μ≤x)=P(Z≤σx−μ)=FZ(σx−μ)dxdFX(x)=fX(x)=fZ(σx−μ)σ1fX(x)=σ2π1e−2σ2(x−μ)2MX(t)=E(eXt)=E(eZ(σt)+μt)=eμtE(eZ(σt))=eμt+σ22t2
표준 정규 분포와 카이제곱 분포
Y=Z2으로 확률 변수 Y를 정의하자.
FY(y)=P(Y≤y)=P(Z2≤y)=P(−y≤Z≤y) (y≥0)=P(Z≤y)−P(Z≤−y)=FZ(y)−FZ(−y)dydFY(y)=fY(y)=2yfZ(y)+fZ(−y)=yfZ(y) (fZ(y)=fZ(−y))=2π1y21−1e2y
fY(y)는 자유도가 1인 카이제곱 분포의 확률 함수와 동일하다. 따라서 Y∼χ2(1)이다.
위 과정을 통해 표준 정규 분포를 제곱한 확률 변수는 자유도가 1인 카이제곱 분포를 따름을 알 수 있다.
독립인 정규 분포 확률 변수의 합의 분포
Xi∼N(μi,σi2),Xi⊥Xj, Y=i=1∑nXiMY(t)=E(eYt)=E(e(∑i=1nXi)t)=i=1∏nE(eXit)=e(∑i=1nμi)t+(∑i=1nσi2)2t2Y∼N(i=1∑nμi,i=1∑nσi2)
독립인 정규 분포의 선형 결합
X∼N(μ1,σ12), Y∼N(μ2,σ22), X⊥YW=aX+bYMW(t)=E(eWt)=E(e(aX+bY)t)=E(eX(at))E(eY(bt))=e(aμ1)t+(a2σ12)2t2⋅e(bμ2)t+(b2σ22)2t2=e(aμ1+bμ2)t+(a2σ12+b2σ22)2t2W∼N(aμ1+bμ2,a2σ12+b2σ22)
이변량 정규 분포
이변량 정규 분포는 정규 분포의 일반화로, 결합 확률 변수는 다음과 같다.
(X,Y)∼Bivariate Normal((μ1,μ2),[σ12ρσ1σ2ρσ1σ2σ22])fX,Y(x,y)=2πσ1σ21−ρ21exp(2(1−ρ2)−1[(σ1x−μ1)2+(σ2y−μ2)2−2ρ(σ1x−μ1)(σ2y−μ2)])
주변 확률 분포
이변량 정규 분포의 각 주변 분포는 정규분포를 따른다.
주의할 점은 X, Y 각각이 정규분포를 따른다고 해서 (X,Y)가 이변량 정규분포가 되는 것은 아니다.
(X,Y)∼B.N(μ,Σ)⇒X∼(μ1,σ12),Y∼(μ2,σ22) :역은 성립하지 않는다.
조건부 확률 함수
이변량 정규 분포의 조건부 확률 분포도 정규 분포를 따른다.
X1∣X2=x2∼N(μ1+ρσ2σ1(x2−μ2),σ12(1−ρ2))