# MDP
총 9개의 포스트

[강화학습] Markov Decision Process
강화학습의 문제를 표현하는 방법인 MDP의 개념과 value-function을 계산하기 위해 기초가 되는 Bellman Equation에 대해 이해하는 챕터
2023년 1월 24일
·
0개의 댓글·
0
Reinforcement learning(강화학습)-MDP(Markov Decision Process)
※참고※ 이번 주제부터는 이전에 배운 개념들을 잘 익혀야 순조롭게 진행될 것입니다. 화이팅!🐱🏍
2022년 7월 19일
·
0개의 댓글·
1Markov Decision Process(MDP)
date: 2021-10-15 22:00:00강화학습에서 agent가 학습을 하는데에 있어서 가장 중요한것은 agent가 풀고자 하는 문제의 정의라고 할 수 있다.문제가 정의가 되어야지 학습을 시작할 수 있기 때문이다사람은 스스로 문제에 대해서 정의를 내릴 수 있지만,
2022년 7월 7일
·
0개의 댓글·
0
강화학습 대체 뭐냐?
이 글에서는 강화학습에 대한 전반적인 내용을 다룰 예정입니다.강화학습(reinforcement learning)은 머신러닝의 한 종류로 어떠한 환경에서 어떠한 행동을 했을 때 보상을 줌으로써 그것이 잘 된 행동인지 잘못된 행동인지를 판단하고 반복을 통해 보상을 최대화하
2022년 6월 28일
·
0개의 댓글·
4[MDP] Infinite-Horizon MDPs
infinite horizon MDP의 구성요소, value function,value iteration, policy iteration
2022년 4월 21일
·
0개의 댓글·
0
[CS234] - Lecture 2 - Given a Model of the World
Model: dynamics과 reward의 수학적 모델Policy: 주어진 state에서 action을 결정하는 함수Value function: 특정 policy를 따를 때 state 및 / 또는 action으로 인한 향후 보상Markov ProcessesMarkov
2020년 12월 27일
·
0개의 댓글·
0