# reinforcement learning

4개의 포스트

06. Noisy Network

강화학습에서의 Agent는 현재상태에서 reward를 많이 받는 action을 선택하기 위해 exploition을 하지만, 다른 더 좋은 reward를 얻기 위해서는 적절하게 exploration이 필요하다. exploition: state 에서 지금까지 경험한 act

3일 전
·
0개의 댓글

01. DQN(Deep Q Leaning)

Neural network를 이용한 function approxiamtor로 기존의 딥러닝 방식의 강화학습이 가진 문제를Experience Replay Buffer와 Fixed Q Targets을 이용해 해모델이 없는 (Model-Free) 환경에서 학습하는 알고리즘.

3일 전
·
0개의 댓글

02. Multi-step TD

MDP를 모르는 경우에도 어떻게 prediction을 하고 어떻게 control을 할지. prediction은 value를 찾는 문제. MC와 TD가 있다.에피소드를 끝까지 수행하고 얻은 결과에 대해 평균으로 value를 취한다. 실제 수행한 값의 평균을 취한다. 목표

2020년 7월 24일
·
0개의 댓글
post-thumbnail

[paper review] Deep Reinforcement Learning of Navigation in a Complex and Crowded Environment with a Limited Field of View (미완성)

네이버에서 2019 ICRA 학회에 발표 했던 강화학습을 이용한 자율주행 논문입니다.paper 진행 순서에 맞춰서 리뷰를 진행해보도록 하겠습니다.1\. INTRODUCTIONNaavigation은

2020년 4월 5일
·
0개의 댓글