시리즈

CS234

1.[ CS234 ] Lecture 1 - Introduction

강화 학습에서 우리는 경험을 통해 교사 없이 행동하는 방법을 배우는 문제를 고려합니다. 강화 학습 에이전트는 세계와 상호 작용해야 하며 이를 통해 시간이 지남에 따라 누적 보상을 최대화하는 방법을 배워야 합니다.강화 학습은 Deep Q-Networks과 같은 주제의 큰

2022년 3월 26일