조건부 기댓값

choyunjeong·2024년 12월 10일

2.4.3 조건부 기댓값

확률변수 XX가 주어졌을 때, YY의 조건부 확률밀도함수는 fYX(yx)=f(x,y)/f(x)f_{Y|X}(y|x)=f(x,y)/f(x)이다. 이 조건부 확률변수 YX=xY|X=x의 기댓값은 E(YX=x)E(Y|X=x)로 표기하고, 다음과 같이 정의한다.

E(YX=x)=yfYX(yx)dyE(Y|X=x)=\int_{-\infty}^{\infty}y\cdot f_{Y|X}(y|x)dy


fX,Y(x,y)=x2ex(y+1)0<x, y<f_{X,Y}(x,y)=x^2e^{-x(y+1)}\quad 0<x,\ y<\infty일 때 YxY|x의 조건부 확률밀도함수는

fYX(yx)=fX,Y(x,y)fX(x)=xexy,y>0f_{Y|X}(y|x)=\frac{f_{X,Y}(x,y)}{f_X(x)}=xe^{-xy},\quad y>0

따라서

E(YX=x)=yxexydyE(Y|X=x)=\int_{-\infty}^{\infty}y\cdot xe^{-xy}dy

정리 2.11
[이중 기댓값 정리]
두 확률변수 X, YX,\ Y에 대하여

E[E(YX)]=E(Y)E[E(Y|X)]=E(Y)

[증명]

E[E(YX)]=E(Yx)fX(x)dx=yfYX(yx)fX(x)dxdy=yfX,Y(x,y)dxdy=yfY(y)dx=E(Y)\begin{aligned} E[E(Y|X)] &=\int_{-\infty}^{\infty}E(Y|x)f_X(x)dx \\[10pt] &=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}y\cdot f_{Y|X}(y|x)f_X(x)dxdy \\[10pt] &=\int_{-\infty}^{\infty}y\int_{-\infty}^{\infty}f_{X,Y}(x,y)dxdy \\[10pt] &=\int_{-\infty}^{\infty}yf_{Y}(y)dx \\[10pt] &=E(Y) \end{aligned}

정리 2.12
두 확률변수 X, YX,\ Y가 독립이면

E(Yx)=E(Y),E(Xy)=E(X)E(Y|x)=E(Y),\quad E(X|y)=E(X)

정의 2.11
X=xX=x가 주어졌을 때, 확률변수 YY의 조건부 분산은

Var(Yx)=E[{YE(Yx)}2x]=E(Y2x)[E(Yx)]2\begin{aligned} \text{Var}(Y|x) &=E[\{Y-E(Y|x)\}^2|x] \\[10pt] &=E(Y^2|x)-[E(Y|x)]^2 \end{aligned}

E(Y2x)=y2fYX(yx)dxE(Y^2|x)=\int_{-\infty}^{\infty}y^2\cdot f_{Y|X}(y|x)dx

정리 2.13
두 확률변수 X, YX,\ Y에 대하여

Var(X)=E[Var(YX)]+Var[E(YX)]\text{Var}(X)=E[\text{Var}(Y|X)]+\text{Var}[E(Y|X)]

[증명]

E[Var(YX)]=E{E(Y2x)[E(Yx)]2}=E(Y2)E[E(Yx)]2]=E(Y2)[E(Y)]2{E[E(Yx)]2][E(E(Yx))]2}=Var(Y)+Var[E(YX)]\begin{aligned} E[\text{Var}(Y|X)] &=E\{E(Y^2|x)-[E(Y|x)]^2\} \\[10pt] &=E(Y^2)-E[E(Y|x)]^2] \\[10pt] &=E(Y^2)-[E(Y)]^2-\{E[E(Y|x)]^2]-[E(E(Y|x))]^2\} \\[10pt] &=\text{Var}(Y)+\text{Var}[E(Y|X)] \end{aligned}

해석
조건부 분산이 무조건부 분산보다 평균적으로 더 작다는 것

E[Var(YX)]Var(Y)E[\text{Var}(Y|X)]\leq\text{Var}(Y)

개별 게체의 산포보다 그룹별 평균의 산보가 작다는 것

Var[E(YX)]Var(Y)\text{Var}[E(Y|X)]\leq\text{Var}(Y)

[참고문헌]

  • 수리통계학 제 5판 - 송성주, 전명식

0개의 댓글