doohyun.log
로그인
doohyun.log
로그인
Direct preference Optimization
이두현
·
2024년 3월 17일
팔로우
0
NLP
reinforcement learning
0
이두현
0100101
팔로우
이전 포스트
REPLUG: Retrieval-Augmented Black-Box Language Models
0개의 댓글
댓글 작성