# Target-Network

1개의 포스트
post-thumbnail

DDPG - 구글은 신이고 딥마인드는 무적이다.

논문 출처: https://arxiv.org/pdf/1509.02971.pdf Background 보통 강화학습의 알고리즘을 테스트하기 위해 많이 사용하는 환경 툴이 Gym의 Cartpole-v1이다. Cartpole에서 Agent는 떨어지지 않기 위해 왼쪽 혹은

2022년 2월 18일
·
0개의 댓글
·