시리즈

[RL] Fundamentals of Reinforcement Learning

1.[RL] Fundamentals of Reinforcement Learning Week 1

Sequential Decision Making에 대해 알아보자.신약 개발을 하는 의사의 입장에서 말이다.A, B, C 세 신약을 두고 테스트를 진행했다고 가정하자.이 중 C 약이 가장 환자들에게 유효하다는 것을 검증했다면 의사는 C 약의 효능을 높이 평가하게 될 것이

2024년 3월 31일

2.[RL] Fundamentals of Reinforcement Learning Week 2

Markov Decision Processes Introduction to Markov Decision Processes Markov Decision Processes

2024년 4월 8일

3.[RL] Fundamentals of Reinforcement Learning Week 3

Policy에 대해 알아보자.이번 강의에서는 각 state에 따른 action을 결정하는 policy distribution에 대해 배운다.Stochastic policy와 deterministic policy의 차이를 이해하고 MDP가 주어졌을 때의 유효한 polic

2024년 4월 21일

4.[RL] Fundamentals of Reinforcement Learning Week 4

Policy Evaluation과 Control이라는 두 가지 distinct task에 대해 알아보자.이 중 Policy Evaluation은 policy를 개선하기 위한 평가 방법이다.이번 강의에서는 policy evaluation과 control(policy im

2024년 4월 28일

5.[RL] Sample-based Learning Methods Week 1

BackwardPreviousNowExampleHit -> StickTurn to DealerHighest estimated value is stickGreedy action is to hit

2024년 4월 29일

6.[RL] Sample-based Learning Methods Week 2

MCTDSummaryExampleMCTDSummary

2024년 5월 8일

7.[RL] Sample-based Learning Methods Week 3

Generalized Policy Iteration을 TD로 improve하는 방법에 대해 알아보자.이번 강의에서는 GPI used with TD와 Sarsa control 알고리즘에 대해 다룬다.Policy Iteration은 Policy Evaluation과 Pol

2024년 5월 12일