시리즈

강화학습

1.Reinforcement Learning

강화학습의 기본 용어

2026년 3월 18일

2.Reinforcement Learning with gymnasium

openai의 gymnasium 환경

2026년 3월 18일

3.Statistics for RL

강화학습의 기반이 되는 확통 정리

2026년 3월 25일

4.Markov Decision Processes

MDP는 강화학습의 환경을 구성하는데 중요한 역할을 하는 수학적 기반

2026년 4월 1일

5.Dynamic Programming

Optimal Policy 를 위한 과정

2026년 4월 8일