OpenAiGym: 강화학습의 이론을 학습하기위해 만들어진 IOpenAI 환경
Mountaincarv0: 두 바퀴가 달린 차로 언덕을 올라가는 문제
-상태와 행동을 분류신경망의 입력과 출력으로 사용해볼 수 있음
어떤 관찰 상태에서 어떤 행동을 해야하는 지 학습
강화학습의 대표적인 방법론
[회귀]
행동공간이 이산적이지 않고 연속적인 mountaincarcontuinuous v0 만들기
랜덤행동 에이전트
회귀모델 =성능 별로
회귀 신경망 대신 큐러닝으로 문제를 풀어볼 수 있음
Q러닝이란