02. Bellman Equation

d4r6j·2024년 1월 4일

reinforcement-ai

reinforcement-ai

목록 보기

2/8

About value function

In MPR (Exercise 1)

In MRP (Markov Reward Process)

Example

In MDP (Exercise 2)

In MDP (Markov Decision Process)

Example

About action-value function

In MDP (Markov Decision Process)

Example

이전 포스트

01. Basic of RL

다음 포스트

03. Bellman Equation

0개의 댓글