DQN

이종욱·2023년 8월 30일

model free learning
마르코프 결정과정 기반
model based learning
비지도학습은 강화학습?

강화학습 알고리즘
Deep Q-learning
Deep Q-network

딥러닝과 강화학습 별개?

PPO 알고리즘
정책 네트워크 가치 네트워크

딥레이서
파라미터 조정 + 보상함수

안녕하세요!

이전 포스트

Today I Learned(8/29)

다음 포스트

TCP/IP

0개의 댓글