2.4 기댓값
확률밀도함수나 확률분포함수는 확률변수의 전체적인 성격을 설명하는데, 때로 우리는 몇개의 수치로 확률분포의 성질을 요약하고자 한다. 대표적으로 기댓값이 있으며 변수의 위치를 나타내는 중요한 모수이다.
E(X)=∫−∞∞xf(x)dx
확률변수 X의 기댓값은 가중평균이라는 것을 알 수 있다. 확률변수 X의 함수인 g(X)의 기댓값 E[g(X)]는 변수 Y=g(x)의 확률밀도함수를 fY(y)라 할 때
EX[g(X)]=fY(y)=∫−∞∞yfY(y)dy
그런데 X의 확률밀도함수를 알고 있다면, Y의 확률밀도함수를 구할 필요 없이 기댓값을 구할 수 있다.
EX[g(X)]=∫−∞∞g(x)fX(x)dx
예
fX(x)=xe−x, (X>0)일 때, g(X)=X2+5의 기댓값은?
E(X2+5)=∫0∞(x2+5)fX(x)dx
2.4.1 기댓값의 성질
정리 2.6
E(c)=cE(aX+b)=aE(X)+b
이와 같은 성질들은 기댓값의 선형성(linearity)을 보여주는데 ∑, ∫가 선형이므로 자연스러운 결과.
두 확률변수 X, Y가 서로 독립이면 E[g(X)h(Y)]=E[(g(X)]⋅E[h(Y)]
2.4.2 분산과 공분산
분산
확률변수 X의 변동을 나타내는 측도로서 X가 평균 E(X)로부터 흩어져 있는 정도를 분산으로 정의하고 다음과 같다
Var(X)=E[X−E(X)]2
분산의 제곱근을 σX=Var(X)로 표기한다.
분산은 단위에 영향을 받으므로 단위가 통일된 표준편차를 사용하여 측정. 나아가, 확률변수 X를 그의 기댓값과 표준편차를 사용하여
Z=σXX−E(X)
로 변환을 하면, Z는 평균이 0이고 분산이 1이 된다. 이러한 변환을 변수의 표준화(standardization)라고 한다.
한변, 확률변수 X의 분산은 E(X)와 E(X2)을 사용하여 다음과 같이 나타낸다.
Var(X)=E[(X−E(X))2]=E[X2−2E(X)X+(E(X))2]=E(X2)−2E(X)E(X)+[E(X)]2=E(X2)−2E(X)2+[E(X)]2=E(X2)−[E(X)]2
정리 2.8
1) 확률변수 X, Y에 대하여, Y=aX+b이면
Var(Y)=a2Var(Y)
[증명]
Var(Y)=E[(aX+b)−E(aX+b)]2=E[aX−E(aX)]2=a2E[X−E(X)]2=a2Var(X)
2) 확률변수 X1,…,Xn이 서로 독립이면
Var(i=1∑nXi)=i=1∑nVar(Xi)
[증명]
Var(X1+X2)=E[(X1+X2)2]−[E(X1+X2)]2=E[(X1+X2)]2−[E(X1)+E(X2)]2=E(X12+2X1X2+X2)−[E(X1)2+2E(X1)E(X2)+E(X2)2]=E(X12)−E(X1)2+E(X22)−E(X2)2=Var(X1)+Var(X2)
공분산
하나의 확률변수가 흩어진 정도를 측정하는 측도로서 분산을 생각했다면, 공분산은 두 확률변수 X, Y 사이의 흩어진 관계를 측정하는 측도로 생각할 수 있다. 공분산은 X, Y가 선형적으로 함계 움직이는 정도를 표현해주는 측도.
정의 2.9
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)
위의 정의로부터
1. Cov(X, X)=Var(X)
2. 두 확률변수 X, Y가 서로 독립이면 Cov(X, Y)=0
[참고문헌]