강화학습 기초 스터디

1.[강화학습 이론] 2장_강화학습 기초1 : MDP와 벨만 방정식

post-thumbnail

2.[강화학습 이론] 3장_강화학습 기초2 : 그리드월드와 다이내믹 프로그래밍

post-thumbnail

3.[강화학습 이론] 4장_강화학습 기초3 : 그리드월드와 큐러닝 1

post-thumbnail

4.[강화학습 이론] 4장_강화학습 기초3 : 그리드월드와 큐러닝 2

post-thumbnail

5.[RL Course] Dynamic Programming 이해해보기

post-thumbnail

6.[RL Course] Monte Carlo, Temporal Difference로 Model Free Prediction 하기

post-thumbnail

7.[RL Course] Prediction한 뒤에Model Free Control로 update하기

post-thumbnail