Air on the C String

Air on the C String

[강화학습] 알고리즘 분류

Eugene CHOI·2021년 5월 11일

강화학습 알고리즘

Reinforcement Learning

목록 보기

13/13

	MDP	DP	MC	TD(SARSA)	QL	DQN	PG	AC	A2C	A3C
Model-based	O	O
Model-free		O	O	O	O
Bootstrap	O		O	O	O		O	O	O
Exploration			O	O	O	O	O	O	O	O
On-policy		O	O
Off-policy				O	O	O	O	O	O
Value-based			O	O	O	O		O	O	O
Policy-based							O	O	O	O
DNN				O	O	O	O	O
Advantage								O	O
Asyncronous

Hi, my name is Eugene CHOI the Automotive MCU FW developer.

이전 포스트

[인공지능] 손실함수와 활성화 함수

0개의 댓글