Air on the C String
로그인
Air on the C String
로그인
[강화학습] 알고리즘 분류
Eugene CHOI
·
2021년 5월 11일
팔로우
0
강화학습
알고리즘
0
Machine Learning
목록 보기
13/13
MDP
DP
MC
TD(SARSA)
QL
DQN
PG
AC
A2C
A3C
Model-based
O
O
Model-free
O
O
O
O
Bootstrap
O
O
O
O
O
O
O
Exploration
O
O
O
O
O
O
O
O
On-policy
O
O
Off-policy
O
O
O
O
O
O
Value-based
O
O
O
O
O
O
O
Policy-based
O
O
O
O
DNN
O
O
O
O
O
Advantage
O
O
Asyncronous
Eugene CHOI
Hi, my name is Eugene CHOI the Automotive MCU FW developer.
팔로우
이전 포스트
[인공지능] 손실함수와 활성화 함수
0개의 댓글
댓글 작성