시리즈

Reinforcement Learning

1.[개념정리] 1. Introduction to Reinforcement Learning

Introduction to Reinforcement Learning

2021년 8월 16일

2.[개념정리] 2. Markov Decision Processes(MDPs)

본 글에서는 강화학습의 핵심인 Markov Decision Processes(MDPs)를 다룬다.

2021년 8월 21일

3.[개념정리] 3. Planning by Dynamic Programming(DP)

Dynamic programming(DP) in Reinforcement Learning

2021년 8월 27일

4.[개념정리] 4. Monte Carlo and Temporal-Difference Methods

이전 글에서는 DP의 연산량 문제, 모델 필요성 등의 단점을 해결하기 위해 Sample backup과 관련된 방법들이 쓰인다고 했습니다. 이 중 대표적인 Monte Carlo방법에 대해 간략하게 다루어봅시다.

2021년 9월 1일

5.[개념정리] 5. Off-Policy Control and Q-learning

Off-policy control and Q-Learning

2021년 9월 5일

6.[개념정리] 6. Value Function Approximation

Value function Approximation

2021년 9월 6일

7.[개념정리] 7. DQN(Deep Q NEtwork)

DQN

2021년 9월 6일

8.[강의용 슬라이드] RL/MDP/Bellman Eq/On-Off Policy/DQN

.

2022년 5월 17일