eric9687.log
로그인
eric9687.log
로그인
강화학습 기초 [2] - Unity와 ML agents
eric9687
·
2022년 4월 24일
팔로우
0
강화학습
0
ML agents에서 제공하는 알고리즘
Reinforcement Learning : 강화학습
Proximal Policy Optimization(PPO)
Soft Actor Critic (SAC)
Curiosity based Exploration (ICM, RNd): Hard Exploration (보상을 얻기가지 복잡한 상황을 수행)
Multi-Agent POsthumous Credit Assignment (MA-POCA):여러 agent들이 공동의 목표를 향해
Imitation Learning : 모방학습
Behavioral Cloning : 단순 모방
Generative Adversarial Imitation Learning (GAIL) : GAN의 방법을 사용
ML agents에서 제공하는 학습 방식
Solving Complex Tasks using Curriculum Learning
순차적으로 단계를 높여가며 학습 수행
Training Robust Agents using Environment Parameter Randomization
환경내의 다양한 파라미터들을 변경하면서 강인한 에이전트를 학습
Multi0Agent Reinforcement Leaning(MARL)
다수의 에이전트를 동시에 제어, 사로 협력/ 경쟁
Training incompettive Multi-Agent Environments with Self-Play
Training in Cooperative Multi-Agent Environments
eric9687
그러나 먼저 된 자로서 나중되고 나중 된 자로서 먼저될 자가 많으니라(마:19:30)
팔로우
이전 포스트
강화학습 기초 [1] - 기초 용어 및 기초 이론
다음 포스트
Tmux 사용하기
0개의 댓글
댓글 작성