시리즈

강화학습 기초 스터디

1.[강화학습 이론] 2장_강화학습 기초1 : MDP와 벨만 방정식

2장 강화학습 기초 : MDP와 벨만방정식

2022년 11월 23일

2.[강화학습 이론] 3장_강화학습 기초2 : 그리드월드와 다이내믹 프로그래밍

3장 강화학습 기초2 : 그리드월드와 다이내믹 프로그래밍

2022년 12월 19일

3.[강화학습 이론] 4장_강화학습 기초3 : 그리드월드와 큐러닝 1

4장 강화학습 기초3 : 그리드월드와 큐러닝 1 (몬테카를로 예측)

2023년 3월 28일

4.[강화학습 이론] 4장_강화학습 기초3 : 그리드월드와 큐러닝 2

[강화학습 이론] 4장_강화학습 기초3 : 그리드월드와 큐러닝 2 (시간차 예측, 살사, 큐러닝)

2023년 3월 29일

5.[RL Course] Dynamic Programming 이해해보기

RL Course by David Silver Lecture 1~3

2023년 4월 6일

6.[RL Course] Monte Carlo, Temporal Difference로 Model Free Prediction 하기

RL Course by David Silver Lecture 4

2023년 4월 10일

7.[RL Course] Prediction한 뒤에Model Free Control로 update하기

RL Course by David Silver Lecture 5

2023년 4월 17일