알고리즘 선택 가이드
https://bit.ly/39oZsRD
강화학습
- 에이전트 Agent (actor, controller): 학습 주체
- 환경 environment: 에이전트에게 주어진 환경, 상황, 조건
- 행동 Action: 환경으로부터 주어진 정보를 바탕으로 에이전트가 판단한 행동
- 보상 Reward: ML엔지니어가 설계한 행동에 대한 보상
주요 알고리즘
- Monte Carlo methods
- Q-Learning
- Policy Gradient methods
주요 커뮤니티