강화학습 기초 [2] - Unity와 ML agents

eric9687·2022년 4월 24일

ML agents에서 제공하는 알고리즘

Reinforcement Learning : 강화학습
- Proximal Policy Optimization(PPO)
- Soft Actor Critic (SAC)
- Curiosity based Exploration (ICM, RNd): Hard Exploration (보상을 얻기가지 복잡한 상황을 수행)
- Multi-Agent POsthumous Credit Assignment (MA-POCA):여러 agent들이 공동의 목표를 향해
Imitation Learning : 모방학습
- Behavioral Cloning : 단순 모방
- Generative Adversarial Imitation Learning (GAIL) : GAN의 방법을 사용

ML agents에서 제공하는 학습 방식

Solving Complex Tasks using Curriculum Learning
- 순차적으로 단계를 높여가며 학습 수행
Training Robust Agents using Environment Parameter Randomization
- 환경내의 다양한 파라미터들을 변경하면서 강인한 에이전트를 학습
Multi0Agent Reinforcement Leaning(MARL)
- 다수의 에이전트를 동시에 제어, 사로 협력/ 경쟁
- Training incompettive Multi-Agent Environments with Self-Play
- Training in Cooperative Multi-Agent Environments

그러나 먼저 된 자로서 나중되고 나중 된 자로서 먼저될 자가 많으니라(마:19:30)

이전 포스트

강화학습 기초 [1] - 기초 용어 및 기초 이론

다음 포스트

Tmux 사용하기

0개의 댓글