강화학습 기초 [2] - Unity와 ML agents

eric9687·2022년 4월 24일
0

ML agents에서 제공하는 알고리즘

  • Reinforcement Learning : 강화학습
    • Proximal Policy Optimization(PPO)
    • Soft Actor Critic (SAC)
    • Curiosity based Exploration (ICM, RNd): Hard Exploration (보상을 얻기가지 복잡한 상황을 수행)
    • Multi-Agent POsthumous Credit Assignment (MA-POCA):여러 agent들이 공동의 목표를 향해
  • Imitation Learning : 모방학습
    • Behavioral Cloning : 단순 모방
    • Generative Adversarial Imitation Learning (GAIL) : GAN의 방법을 사용

ML agents에서 제공하는 학습 방식

  • Solving Complex Tasks using Curriculum Learning
    • 순차적으로 단계를 높여가며 학습 수행
  • Training Robust Agents using Environment Parameter Randomization
    • 환경내의 다양한 파라미터들을 변경하면서 강인한 에이전트를 학습
  • Multi0Agent Reinforcement Leaning(MARL)
    • 다수의 에이전트를 동시에 제어, 사로 협력/ 경쟁
    • Training incompettive Multi-Agent Environments with Self-Play
    • Training in Cooperative Multi-Agent Environments
profile
그러나 먼저 된 자로서 나중되고 나중 된 자로서 먼저될 자가 많으니라(마:19:30)

0개의 댓글