# RLHF

3개의 포스트
post-thumbnail

RLHF란?

RLHF에 대해 알아보자

2023년 5월 25일
·
0개의 댓글
·
post-thumbnail

StableVicuna

최근, chatbot의 개발 및 릴리즈에 상당한 추진이 있었다. Chracter.ai의 chatbot에서 ChatGPT, Bard까지, 채팅을 이용해 봇을 튜닝하는 유저들의 경험은 매우 뜨거운 주제가 되었다. 이러한 뜨거운 관심에 오픈소스의 출현과 오픈소스 대체제가

2023년 5월 1일
·
0개의 댓글
·
post-thumbnail

[논문리뷰] Learning to summarize from human feedback

As language models become more powerful, training and evaluation are increasinglybottlenecked by the data and metrics used for a particular task. For

2023년 5월 1일
·
0개의 댓글
·