
Sequential Decision Making에 대해 알아보자.신약 개발을 하는 의사의 입장에서 말이다.A, B, C 세 신약을 두고 테스트를 진행했다고 가정하자.이 중 C 약이 가장 환자들에게 유효하다는 것을 검증했다면 의사는 C 약의 효능을 높이 평가하게 될 것이

Markov Decision Processes Introduction to Markov Decision Processes Markov Decision Processes

Policy에 대해 알아보자.이번 강의에서는 각 state에 따른 action을 결정하는 policy distribution에 대해 배운다.Stochastic policy와 deterministic policy의 차이를 이해하고 MDP가 주어졌을 때의 유효한 polic

Policy Evaluation과 Control이라는 두 가지 distinct task에 대해 알아보자.이 중 Policy Evaluation은 policy를 개선하기 위한 평가 방법이다.이번 강의에서는 policy evaluation과 control(policy im

BackwardPreviousNowExampleHit -> StickTurn to DealerHighest estimated value is stickGreedy action is to hit

MCTDSummaryExampleMCTDSummary

Generalized Policy Iteration을 TD로 improve하는 방법에 대해 알아보자.이번 강의에서는 GPI used with TD와 Sarsa control 알고리즘에 대해 다룬다.Policy Iteration은 Policy Evaluation과 Pol