# td error

1개의 포스트

Monte Carlo Prediction and Temporal Difference Error

date: 2021-10-18 12:00:00우리는 policy iteration을 policy evaluation과 policy improvemet를 통해서 다이나믹 프로그래밍을 이용해 계산을 하였다.그런데, 대부분의 문제는 다이나믹 프로그래밍을 적용하기 어렵다.그

2022년 7월 7일
·
0개의 댓글
·