# DRL

3개의 포스트
post-thumbnail

Maximum Entropy Reinforced Single Object Visual Tracking

기존 강화학습을 이용한 Visual Tracking 알고리즘들은 Exploration 전략이 부족해 Local Optimal(non-target detection)에 빠지는 경우가 많았고 이것을 극복하지 못했다. 이 연구에서는 Exploration을 Entropy로 정

2022년 2월 9일
·
0개의 댓글
post-thumbnail

Improved Soft Actor-Critic: Mixing Prioritized Off-Policy Samples with On-Policy Experience -논문 리뷰

논문 출처: https://arxiv.org/abs/2109.11767https://velog.io/@everyman123/PRIORITIZED-EXPERIENCE-REPLAY-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0http

2022년 2월 7일
·
0개의 댓글
post-thumbnail

PRIORITIZED EXPERIENCE REPLAY - 논문 리뷰

논문 출처: https://arxiv.org/abs/1511.05952DQN의 목표는 신경망이 최적 Q함수에 근사하는 것이다. 하지만 최적 Q함수 $Q^\*$ 을 표현하는 방법이 없기 때문에 벨만 방정식을 이용해 Target-Q(최적 Q함수)를 표현하고 Q-n

2022년 2월 1일
·
0개의 댓글