시리즈

reinforcement-ai

1.01. Basic of RL

Basic of RL MP, MRP, MDP ..

2024년 1월 4일

value, action-value function and example..

2024년 1월 4일

bellman equation for convert matrix, optimality

2024년 1월 14일

About policy evaluation..

2024년 2월 4일

Policy Evaluation Example

2024년 2월 27일

Find optimal policy using policy improvement.

2024년 5월 28일

policy iteration - policy evaluation 과 policy improvement 의 반복, optimal value function 과 policy 를 찾는 과정.

2024년 8월 4일

deep dive on value iteration

2025년 2월 27일