d4r6j.log
로그인
d4r6j.log
로그인
02. Bellman Equation
d4r6j
·
2024년 1월 4일
팔로우
0
reinforcement-ai
0
reinforcement-ai
목록 보기
2/7
About value function
In MPR (Exercise 1)
In MRP (Markov Reward Process)
Example
In MDP (Exercise 2)
In MDP (Markov Decision Process)
Example
About action-value function
In MDP (Markov Decision Process)
Example
d4r6j
팔로우
이전 포스트
01. Basic of RL
다음 포스트
03. Bellman Equation
0개의 댓글
댓글 작성