1. 강화학습 > 에이전트(Agent)가 환경(Environment)과 상호작용하며 목표를 달성하기 위해 스스로 의사결정하는 방법을 배우는 법 2. Bellman 방정식 에이전트가 어떤 행동에 대한 가치를 부여하는 방정식이다. > 변수 정의 s - State (모든