학습 : 주변 환경과 상호작용을 통해 배우는 것강화학습 : 인공지능 연구자나 엔지니어의 시각에서 컴퓨터를 활용하는(Computational) 상호작용으로, 이상적인 학습 환경에서 다양한 방법이 가지는 효과를 수학적 분석과 컴퓨터 실험을 통해서 분석한다.'학습자(Agen
강화학습은 1) 동물 심리학에서 유래된 시행착오학습, 2) 가치 함수와 동적 프로그래밍을 이용하는 최적 제어의 문제와 해결책, 3) 시간차 방법세 가지의 갈래가 1980년대 후반에 모여서 현대 강화학습을 만들어냈다.최적 제어 : 어떤 동역학 시스템에 시간에 따른 결과를