profile
AI Researcher 가 되고 싶어요
post-thumbnail

강화학습 - Q-learning/Q-network/Experience Replay

Q-learning은 optimal policy를 찾는 해결 방법이고, 모델 없이 학습하는 강화학습의 알고리즘이다.Q-learning 주어진 state에서 주어진 action을 수행하는 것이 가져다 줄 reward의 기댓값을 예측하는 함수인 Q-function을 사용함

2021년 10월 12일
·
0개의 댓글
post-thumbnail

강화학습 - policy, value function, Q*, Bellman equation

강화학습(reinforcement learning)

2021년 10월 11일
·
0개의 댓글
post-thumbnail

강화학습(reinforcement learning) - 원리와 성질, 계산 모형, state, action, reward, Markov Decision Process

cs231n 마지막 강의 Lecture14를 준비하면서 대망의 Deep Reinforcement Learning 파트를 공부하게 되었습니다.(15,16강은 특강이라 pass) 강화학습은 뭐랄까... 저한테 늘 최종 보스 같은 느낌이었는데요. 어쩌다보니 발표도 맡게 되었

2021년 10월 10일
·
0개의 댓글