# MDP

9개의 포스트
post-thumbnail

[강화학습] Markov Decision Process

강화학습의 문제를 표현하는 방법인 MDP의 개념과 value-function을 계산하기 위해 기초가 되는 Bellman Equation에 대해 이해하는 챕터

2023년 1월 24일
·
0개의 댓글
·
post-thumbnail

Reinforcement learning(강화학습)-MDP(Markov Decision Process)

※참고※ 이번 주제부터는 이전에 배운 개념들을 잘 익혀야 순조롭게 진행될 것입니다. 화이팅!🐱‍🏍

2022년 7월 19일
·
0개의 댓글
·

Markov Decision Process(MDP)

date: 2021-10-15 22:00:00강화학습에서 agent가 학습을 하는데에 있어서 가장 중요한것은 agent가 풀고자 하는 문제의 정의라고 할 수 있다.문제가 정의가 되어야지 학습을 시작할 수 있기 때문이다사람은 스스로 문제에 대해서 정의를 내릴 수 있지만,

2022년 7월 7일
·
0개의 댓글
·
post-thumbnail

강화학습 대체 뭐냐?

이 글에서는 강화학습에 대한 전반적인 내용을 다룰 예정입니다.강화학습(reinforcement learning)은 머신러닝의 한 종류로 어떠한 환경에서 어떠한 행동을 했을 때 보상을 줌으로써 그것이 잘 된 행동인지 잘못된 행동인지를 판단하고 반복을 통해 보상을 최대화하

2022년 6월 28일
·
0개의 댓글
·

[MDP] Linear Programming

LP를 활용한 MDP 풀이 공식

2022년 4월 21일
·
0개의 댓글
·

[MDP] Infinite-Horizon MDPs

infinite horizon MDP의 구성요소, value function,value iteration, policy iteration

2022년 4월 21일
·
0개의 댓글
·
post-thumbnail

1. MDP - Bellman Equation

mdp에 대해서 살펴볼 예정.

2022년 1월 13일
·
0개의 댓글
·
post-thumbnail

[강화학습] MDP

MDP란 의사결정 과정을 쉽게 도식화 하는 방법 중에 하나입니다.

2021년 6월 10일
·
0개의 댓글
·
post-thumbnail

[CS234] - Lecture 2 - Given a Model of the World

Model: dynamics과 reward의 수학적 모델Policy: 주어진 state에서 action을 결정하는 함수Value function: 특정 policy를 따를 때 state 및 / 또는 action으로 인한 향후 보상Markov ProcessesMarkov

2020년 12월 27일
·
0개의 댓글
·