강화학습

1.MDP(마르코프 결정 프로세스)

post-thumbnail

2.Bellman Equation

post-thumbnail