강화 학습에서 우리는 경험을 통해 교사 없이 행동하는 방법을 배우는 문제를 고려합니다. 강화 학습 에이전트는 세계와 상호 작용해야 하며 이를 통해 시간이 지남에 따라 누적 보상을 최대화하는 방법을 배워야 합니다.강화 학습은 Deep Q-Networks과 같은 주제의 큰