https://spinningup.openai.com/en/latest/spinningup/keypapers.html
Playing Atari with Deep Reinforcement Learning [Before starting] Deep Learning과 Reinforcement Learning을 적용하여 사람과 비슷한 성능을 낸 논문으로 DQN을 공부할 시 가장 처음 접하게 되
Deep Recurrent Q-Learning for Partially Observable MDPs [Before starting] 기존의 DQN은 연속적인 state들을 알아야 하는 문제들에 대해서 특정 개수의 연속적인 state들을 쌓아 neural network