충분통계량에 대한 이야기를 하기 전에, 기초적인 통계적 정리들에 대해 알아보고 넘어가자.
우선, 조건부 확률은 다음과 같이 정의된다.
P(y∣x)=PX(x)PX,Y(x,y)
그리고 결합 분포가 주어졌을때, X의 marginal 분포는 다음과 같이 정의된다.
PY(y)=∫x∈XPX,Y(x,y)dx
(x는 연속 변수일때라고 가정, 이산 변수일때는 ∑ 연산으로 수행)
이중기댓값 정리
두 확률변수 X, Y에 대해서, E[E[Y∣X]]=E[Y] 가 성립한다.
증명
E[E[Y∣X]]=∫x∈XfX(x)E[Y∣X]dx=∫x∈X∫y∈YyfY∣X(y∣x)fX(x)dxdy=∫y∈Yy∫x∈XfX,Y(x,y)dxdy=∫y∈YyfY(x)dy=E[Y]
총분산 정리
두 확률변수 X, Y에 대해서, Var(Y)=E[Var(Y∣X)]+Var(E[Y∣X]) 가 성립한다.
증명
E[Var(Y∣X)]Var(E[Y∣X])=E[E(Y2∣X)−(E[Y∣X])2]=E(Y2)−E[(E[Y∣X])2],=E[(E[Y∣X])2]−(E[Y])2.
E[Var(Y∣X)]+Var(E[Y∣X])=(E(Y2)−E[(E[Y∣X])2])+(E[(E[Y∣X])2]−(E[Y])2)=E(Y2)−(E[Y])2=Var(Y).
이는
전체 분산 = 그룹내 분산에 대한 평균 + 그룹간 평균에 대한 분산 = 그룹내 설명할 수 없는 변동성 + 그룹간 설명될 수 있는 변동성
으로 해석할 수 있다.
(https://m.blog.naver.com/skkong89/222463905064 참고)
갑자기 든 생각인데, 이 정리를 마코프 가정과 SDE 관점으로의 확장을 하면,
Var(Yt)=E[Var(Yt∣Ys)]+Var(E[Yt∣Ys])
로 다시 표현할 수 있다.
이는
t시점의 전체 변동성 Var(Yt)는
(1) 서로 다른 초기 상태 Ys가 만들어 내는 평균 궤적 차이 Var(E[Yt∣Ys])와
(2) Ys를 고정해도 s→t 구간에서 새로 유입되는 무작위성 E[Var(Yt∣Ys)] 로 분해된다.
위와 같은 확장이 가능할거라 생각한다.