# RL

117개의 포스트
post-thumbnail

강화학습기초(7) - Policy Gradient, REINFORCE, Actor-Critic

앞선 value-based 방법에 반해, policy 자체를 estimate하는 policy gradient, REINFORCE, actor-critic에 대해 살펴본다.

2023년 2월 10일
·
0개의 댓글
·
post-thumbnail

강화학습기초(6) - Value Function Approximation, Deep Q-Networks

앞선 tabular RL 방식과 달리 function의 parameter만 저장하는 value function approximation의 개념과 DeepMind에서 제시한 Deep Q-Networks를 살펴본다.

2023년 2월 9일
·
0개의 댓글
·
post-thumbnail

강화학습기초(5) - Off-Policy Control, Importance Sampling, Q-Learning

Importance sampling을 적용한 off-policy MC/TD와 이를 적용하지 않은 Q-learning의 원리에 대해 살펴본다.

2023년 2월 9일
·
0개의 댓글
·
post-thumbnail

강화학습기초(4) - Temporal Difference Learning, SARSA

두 번째 학습방식인 temporal difference learning과 이로부터 파생된 SARSA, eligibility trace의 개념을 살펴본다.

2023년 2월 8일
·
0개의 댓글
·
post-thumbnail

강화학습기초(3) - Monte-Carlo Learning

첫 번째 학습방식인 Monte-Carlo learning과 epsilon-greedy policy control의 개념을 살펴본다.

2023년 2월 8일
·
0개의 댓글
·
post-thumbnail

강화학습기초(2) - Dynamic Programming

RL의 고전기법인 dynamic programming을 policy iteration과 value iteration으로 나누어 살펴본다.

2023년 2월 8일
·
0개의 댓글
·
post-thumbnail

강화학습기초(1) - MDP, Bellman Equation

강화학습의 기본개념과 MDP 및 value function의 정의를 살펴보고, 이의 관계식에 해당하는 Bellman equation에 대해 다뤄본다.

2023년 2월 8일
·
0개의 댓글
·
post-thumbnail

[강화학습] 상태 가치 함수 vs 행동 가치 함수

현재 상태가 얻을 Return의 기댓값 -> 현재 State에 대한 가치를 내놓는 함수 가치(value) = 어떤 상태가 얼마나 좋은 상태인지= Agent가 state s에서 탐험을 시작할 경우, 평균적으로 v(s)만큼의 감가율이 적용된 reward를 받을 것이다\->

2023년 1월 9일
·
0개의 댓글
·

[Project] 강화학습을 활용한 트레이딩 봇

강화학습을 사용한 선물거래 봇 생성 프로젝트

2023년 1월 7일
·
0개의 댓글
·
post-thumbnail

[강화학습] 1. Markov Decision Process (MDP)

State에서 action을 해서 그에 대한 reward를 받고 새로운 state로 나아간다S - A - R - S' 가 계속 반복된다 / S0 A0 R1 S1 A1 R2 S2 A2 ....Agent : MDP에서 문제를 학습하고 행동을 결정하는 주체Environmen

2023년 1월 6일
·
0개의 댓글
·
post-thumbnail

[강화학습] 0. Introduction, 용어 정리

강화학습은 discrete time 에서 stochastic 하게 agent를 control하는 문제이다.Agent는 Policy에 따라 행동을 결정한다Agent의 행동에 따라 상태가 전이된다전이된 상태에서의 Reward를 Agent에게 준다Agent는 Reward에

2023년 1월 1일
·
0개의 댓글
·
post-thumbnail

[강화학습] Introduction to Reinforcement Learning

강화학습이 무엇인지에 대해 그 정의를 살펴보고 어디서 유래했는지 알아보는 챕터

2022년 12월 27일
·
0개의 댓글
·
post-thumbnail

[Computers and Electronics in Agriculture 2022] Reinforcement learning for crop management support: Review, prospects and challenges

이번에 소개드릴 논문은 Computers and Electornics in Agriculture에 몇 달 전 게제된 따끈따끈한 리뷰 논문입니다. <Reinforcement learning for crop management support: Review, pros

2022년 12월 7일
·
0개의 댓글
·
post-thumbnail

[RSS '21] RMA: Rapid Motor Adaptation for Legged Robots

RMA 논문리뷰

2022년 11월 29일
·
0개의 댓글
·
post-thumbnail

[ICRA '20] Meta Reinforcement Learning for Sim to real Domain Adaptation

Policy simplification과 meta learning을 통해 domain adaptation을 푼 논문 리뷰

2022년 11월 24일
·
0개의 댓글
·
post-thumbnail

[AAMAS '19] Domain Adaptation for Reinforcement Learning on the Atari

Atari benchmark 강화학습 domain adaptation 논문 리뷰

2022년 11월 24일
·
0개의 댓글
·

[ICML '18] Graph Networks as Learnable Physics Engines for Inference and Control

Graph Networks as Learnable Physics Engines for Inference and Control 논문 리뷰

2022년 8월 4일
·
0개의 댓글
·
post-thumbnail

Reinforcement learning(강화학습)-MDP(Markov Decision Process)

※참고※ 이번 주제부터는 이전에 배운 개념들을 잘 익혀야 순조롭게 진행될 것입니다. 화이팅!🐱‍🏍

2022년 7월 19일
·
0개의 댓글
·