선형 확률 차분방정식

Kiwoong Park·2024년 3월 7일

선형 확률 차분방정식

정의 및 유도

다음 식으로 표현되는 랜덤벡터의 시간 전파식(propagation)을 선형 확률 차분방정식(linear stochastic difference equation)이라고 한다.

Xt+1=FtXt+GtWtX_{t+1} = F_tX_t+G_tW_t

여기서 XtRnX_t \in R^n은 랜덤벡터, WtRnW_t \in R^n는 이산시간 프로세스 노이즈라고 한다. Ft,GtF_t,G_t는 각각 시스템 행렬과 노이즈 게인 행렬이라고 하는데, 모두 확정된 값(deterministic value)을 갖는다. 랜덤벡터의 초깃값 X0X_0의 평균과 공분산은 다음과 같이 주어진다고 가정한다.

E[X0]=X0ˉE[(X0X0ˉ)(X0X0ˉ)T]=P0E[X_0]=\bar{X_0} \\ E[(X_0 - \bar{X_0})(X_0 - \bar{X_0})^T] = P_0

프로세스 노이즈 WtW_t는 평균이 0이고 공분산이 QtQ_t인 화이트 노이즈라고 가정한다.

E[Wt]=0E[WtWt+mT]=QtδmE[W_t]=0 \\ E[W_t W_{t+m}^T] = Q_t\delta_m

그러면 랜덤벡터 XtX_t의 평균은 다음과 같이 전파된다.

E[Xt+1]=E[FtXt+GtWt]=FtE[Xt]+GtE[Wt]=FtE[Xt]E[X_{t+1}] = E[F_t X_t +G _tW_t] \\ = F_tE[X_t]+G_tE[W_t] \\ = F_tE[X_t]

여기서 E[X0]=X0ˉE[X_0]=\bar{X_0} 로 주어졌으므로 랜덤벡터의 평균 전파식은 확정적인 식임을 알 수 있다. 즉, 초기값의 평균이 그대로 전파된다.
이번에는 랜덤벡터의 공분산 전파식을 구해보자.

💡 행렬의 곱의 전치행렬은 순서를 뒤집은 전치행렬의 곱이다.

(AB)T=BTAT(ABC)T=CTBTAT,Ft(XtE[Xt])(Ft(XtE[Xt]))T=Ft(XtE[Xt])(XtE[Xt])TFtT(AB)^T = B^TA^T \\ (ABC)^T = C^TB^TA^T \\즉, F_t(X_t-E[X_t])(F_t(X_t-E[X_t]))^T = F_t(X_t-E[X_t])(X_t-E[X_t])^TF_t^T

랜덤벡터의 공분산 전파식은

(Xt+1E[Xt+1])(Xt+1E[Xt+1])T=(FtXt+GtWtFtE[Xt])(FtXt+GtWtFtE[Xt])T=Ft(XtE[Xt])(XtE[Xt])TFtT+GtWtWtTGtT+GtWt(XtE[Xt])T+Ft(XtE[Xt])WtTGtT(X_{t+1}-E[X_{t+1}])(X_{t+1}-E[X_{t+1}])^T \\ = (F_tX_t +G_tW_t-F_tE[X_t])(F_tX_t +G_tW_t-F_tE[X_t])^T \\ = F_t(X_t-E[X_t])(X_t-E[X_t])^TF_t^T+G_tW_tW_t^TG_t^T \\ + G_tW_t(X_t-E[X_t])^T +F_t(X_t-E[X_t])W_t^TG_t^T

위 식의 기댓값이 공분산이므로,

Pt+1=E[(Xt+1E[Xt+1])(Xt+1E[Xt+1])T]=FtE[(XtE[Xt])(XtE[Xt])T]FtT+GtE[WtWtT]GtT+GtE[Wt(XtE[Xt])T]+FtE[(XtE[Xt])WtT]GtT=FtPtFtT+GtQtGtT+GtMtTFt+FtMtGtTP_{t+1} = E[(X_{t+1}-E[X_{t+1}])(X_{t+1}-E[X_{t+1}])^T] \\ = F_tE[(X_t-E[X_t])(X_t-E[X_t])^T]F_t^T+G_tE[W_tW_t^T]G_t^T \\ + G_tE[W_t(X_t-E[X_t])^T]+F_tE[(X_t-E[X_t])W_t^T]G_t^T \\ = F_tP_tF_t^T+G_tQ_tG_t^T+G_tM_t^TF_t + F_tM_tG_t^T

이 된다. 랜덤벡터의 초깃값과 프로세스 노이즈가 비상관 관계에 있으면, E[(X0X0ˉ)WtT]=0E[(X_0-\bar{X_0})W_t^T]=0이면 Mt=E[(XtE[Xt])WtT]=0M_t=E[(X_t-E[X_t])W_t^T]=0이므로 공분산 전파식은 다음과 같이 간단하게 정리된다.

Pt+1=FtPtFtT+GtQtGtTP_{t+1}= F_tP_tF_t^T+G_tQ_tG_t^T

공분산 전파식은 모두 확정된 값(FtF_t~시스템 행렬, GtG_t~노이즈게인 행렬, QtQ_t~화이트 노이즈의 공분산)을 갖는 행렬의 함수로 되어있기 때문에 확정적인 식이다.

🛠 활용 - 랜덤워크

✍ 선형 확률 차분방정식은 외란 및 모델 오차가 있는 시스템의 수학적 동역학 모델을 만드는 데 이용된다. 또한 다양한 랜덤 시퀀스를 생성하는 데도 이용된다. 예를 들면, 랜덤워크(random walk)는 다음 식으로 모델링할 수 있다.

Xt+1=Xt+Wt,X0=0,P0=0E[Wt2]=qX_{t+1} = X_t + W_t, X_0=0, P_0=0 \\ E[W_t^2]=q

그러면 평균 전파식은 E[Xt+1]=E[Xt+Wt]=E[Xt]=0E[X_{t+1}]=E[X_t+W_t]=E[X_t]=0이 되고 공분산은 Pt+1=Pt+qP_{t+1}=P_t+q이므로 Pt=qtP_t=qt가 되어 분산은 시간이 지남에 따라 비례적으로 커짐을 알 수 있다.

References
[1] 박성수. (2020). 수학으로 풀어보는 강화학습 원리와 알고리즘. 위키북스

profile
You matter, never give up

0개의 댓글