# Temporal Difference Error
총 1개의 포스트
Monte Carlo Prediction and Temporal Difference Error
date: 2021-10-18 12:00:00우리는 policy iteration을 policy evaluation과 policy improvemet를 통해서 다이나믹 프로그래밍을 이용해 계산을 하였다.그런데, 대부분의 문제는 다이나믹 프로그래밍을 적용하기 어렵다.그
2022년 7월 7일
·
0개의 댓글·
0