시리즈

단단한 강화학습

1.#1. 소개(1)

학습 : 주변 환경과 상호작용을 통해 배우는 것강화학습 : 인공지능 연구자나 엔지니어의 시각에서 컴퓨터를 활용하는(Computational) 상호작용으로, 이상적인 학습 환경에서 다양한 방법이 가지는 효과를 수학적 분석과 컴퓨터 실험을 통해서 분석한다.'학습자(Agen

2022년 5월 9일

2.#1. 소개(2)

강화학습은 1) 동물 심리학에서 유래된 시행착오학습, 2) 가치 함수와 동적 프로그래밍을 이용하는 최적 제어의 문제와 해결책, 3) 시간차 방법세 가지의 갈래가 1980년대 후반에 모여서 현대 강화학습을 만들어냈다.최적 제어 : 어떤 동역학 시스템에 시간에 따른 결과를

2022년 5월 9일