# model based

3개의 포스트
post-thumbnail

Generative model: Dream to Control

Background Artificial agent가 목표를 달성하기 위해 행동을 선택할 수 있는 방법에 대한 연구는 강화 학습(RL)의 활용으로 인해 상당 부분 급속한 진전을 이루고 있습니다. 시행착오를 통해 성공적인 행동을 예측하는 RL에 대한 model-free

2023년 4월 9일
·
0개의 댓글
·
post-thumbnail

[강화학습] Planning by Dynamic Programming

model을 알고 있을 때(=MDP를 알 떄), Reinforcement Learning에서 Prediction 문제와 Control 문제를 해결하는 방법을 배우는 챕터 (with. DP)

2023년 1월 28일
·
0개의 댓글
·
post-thumbnail

강화학습 개념정리(3) - 알고리즘 종류, on-policy, off-policy, Q러닝, Policy Gradient, Model-Free, Model-Based

미리 말하자면, 위 분류는 완벽하지 않다. RL의 특성 상 트리 구조로 엄밀하게 분류하기가 힘들기 때문이다. 예를들어 Policy Gradient 와 Value Function을 둘다 사용하는 DDPG, TD3, SAC는 세부적으로 다르게 작동하지만 트리구조 상에서는

2021년 7월 19일
·
0개의 댓글
·