# Q learning

11개의 포스트
post-thumbnail

Reinforcement learning(강화학습)-MDP(Markov Decision Process)

※참고※ 이번 주제부터는 이전에 배운 개념들을 잘 익혀야 순조롭게 진행될 것입니다. 화이팅!🐱‍🏍

2022년 7월 19일
·
0개의 댓글
·
post-thumbnail

Reinforcement learning(강화학습)-Q-learning_02

🙄Q-value를 초기화하는 방법을 들여다보자.

2022년 7월 18일
·
0개의 댓글
·
post-thumbnail

Reinforcement learning(강화학습)-Q-learning_01

오늘 살펴볼 것은 강화학습 이론과 Q-learning의 Greedy action이다.

2022년 7월 15일
·
0개의 댓글
·

Q-Learning (code)

layout: posttitle: Q-Learning (code)comments: truecategories: DataScience/Reinforcement Learningtags: q-learning, 큐러닝, Reinforcement Learning, 강화학습, r

2022년 7월 7일
·
0개의 댓글
·

Q-Learning(큐러닝)

date: 2021-10-18 18:00:00이전 포스트에 이어서 이번에는 q-learning을 해보겠다.q-learning은 SALSA 와 다르게 SALS만 하는것이다,왜 그러면 마지막 A를 뻈을까??2021-10-18-rlpost10-01.png왼쪽은 SALSA 오

2022년 7월 7일
·
0개의 댓글
·
post-thumbnail

[HUFS RL] 강화학습 : Reinforcement Learning: Q- Learning

Q-Learning Q learning이란 : Q -learning이란 벨만 방정식을 이용하여 미래가치를 예상하여 action을 정하는 방법으로 Model-Free Reinforcement Learning의 한 종류입니다. 벨만 방정식, Q-Table 그리고 Expl

2022년 2월 16일
·
0개의 댓글
·
post-thumbnail

Off-Policy TD Q-Learning

강화학습 시리즈는 패스트캠퍼스 박준영 강사님의 수업과 Sergey Levine의 Deep Reinforcement Learning 그리고 서튼의 강화학습 교재를 참고하여 만들어졌고 어떤 상업적 목적이 없음을 밝힙니다.$V(s)=\\sum\\limits{a \\in A(

2022년 2월 8일
·
0개의 댓글
·
post-thumbnail

Asynchronous Episodic Deep Deterministic Policy Gradient: Towards Continuous control in Computationally Complex Environments -논문 리뷰

논문 출처: https://arxiv.org/abs/1903.00827오늘은 이전에 소개한 Prioritized-Experience-Replay 처럼 Sample에 우선순위를 두어 Data-Efficient 를 높인 논문을 소개하겠다.Prioritized-Ex

2022년 2월 7일
·
0개의 댓글
·
post-thumbnail

강화학습 개념정리(3) - 알고리즘 종류, on-policy, off-policy, Q러닝, Policy Gradient, Model-Free, Model-Based

미리 말하자면, 위 분류는 완벽하지 않다. RL의 특성 상 트리 구조로 엄밀하게 분류하기가 힘들기 때문이다. 예를들어 Policy Gradient 와 Value Function을 둘다 사용하는 DDPG, TD3, SAC는 세부적으로 다르게 작동하지만 트리구조 상에서는

2021년 7월 19일
·
0개의 댓글
·
post-thumbnail

[강화학습] Q-Learning

이 포스트는 홍콩 과기대의 김성훈 교수님(Sung Kim)의 강의와 여러 서적에서 배운 내용을 정리하는 흔적입니다.

2021년 3월 29일
·
0개의 댓글
·
post-thumbnail

강화학습이란? Reinforcement Learning, RL overview

NASNet이나, RL for abstractive Summarization 등 딥러닝을 공부하다보면 한 번씩 RL 개념이 튀어나온다.한 번쯤 공부해보고 싶었던 강화학습을 드디어 동아리 스터디 세션에서 가볍게나마 다뤄보았다. 이전까지는 강화학습이 딥러닝에 속하는 sub

2021년 2월 22일
·
0개의 댓글
·