시리즈

강화학습 Reinforcement Learning

1.[MDP] Markov Decision Process (MDP) 의 개념

MDP의 개념, 기본용어, 목표

2022년 4월 19일

2.[MDP] Optimal Value Function & Bellman Equation

optimal value function과 Bellman Equation을 통해 MDP 문제 풀기

2022년 4월 19일

3.[MDP] Finite-Horizon MDPs

Finite-Horizon MDP 문제를 푸는 법 - Optimal Value Function 구하는 DP 문제

2022년 4월 20일

4.[MDP] Infinite-Horizon MDPs

infinite horizon MDP의 구성요소, value function,value iteration, policy iteration

2022년 4월 21일

5.[MDP] Linear Programming

LP를 활용한 MDP 풀이 공식

2022년 4월 21일

6.Q-Function

Q-function의 형태와 여러 특징

2022년 4월 21일

7.[강화학습] Reinforcement Learning

강화학습의 기본 배경과 특징

2022년 4월 21일

8.[강화학습] Stochastic Approximation

approximation을 통해 optimal 값을 구하기 위한 조건

2022년 4월 21일

9.Temporal Difference Learning

.

2022년 4월 21일