[논문 리뷰] Learning Retrieval Augmentation for Personalized Dialogue Generation

sihyeong·2024년 10월 18일

RAG

목록 보기

2/11

RAG(Retrieval-Augmented Generation)
- retriever과 generator를 결합한 프레임워크
- 질문에 답하기 위해 모델의 내부 지식만을 바탕으로 답을 하는 것이 아니라 외부 지식 소스를 이용하여 답 가능
  - hallucination ↓
Personalized-dialogue Generation
- 대화형 AI 모델이 사용자의 성격, 취향, 과거 대화 등을 반영한 개인 맞춤형 응답을 생성하는 task

ConvAI2 Dataset

personalized dialogue generation의 경우, historical context와 pre-defined persona를 바탕으로 일관된 응답의 생성을 목표로 함
하지만, ConvAI2 데이터셋의 경우 persona를 담고 있는 문장이 4~5개밖에 안됨
→ 다양하고 풍부한 답변의 생성이 어려움

ROCStory

ROCStory는 title에 대한 story가 주어져있는 데이터셋으로 저자는 해당 데이터셋을 통해 persona profile을 풍부하게 만들 수 있을 것이라고 생각
그럼에도 불구하고 ROCStory라는 외부지식을 어떻게 주입할 수 있을지가 문제
1) 검색해오기 위한 명시적 주석 부족
2) story 검색 성능 평가의 어려움
3) dense retriever 자체의 문제점
: dense retriever의 경우 예측된 확률분포가 기반이 됨
→ 주어진 query에 대한 검색해오는 문서가 대체로 비슷하기 때문에 다양한 문서를 긁어올 수 없게 됨

Two-stage training process
: training generator → tune the retriever + learn the retrieval augmentation

1. Train the Generator

generator를 supervised training
- NLL(Negative Log-Likelihood)를 minimize하는 방향으로 generator를 supervised fine-tuning
- architecture 그림 ①에 해당함

2. Learning Retrieval Augmentation

3. Retrieval Candidate Augmentation

4. Training Retrieval-Augmented Generator

모든 지표에서 LAPDOG을 결합한 모델이 제일 성능이 좋음
모델 사이즈와 상관없이 일관적으로 향상됨
- retriever : Contriever
  - BERT와 유사한 dual-encoder retriever
- generator : T5

문서 candidate의 수가 증가하면 성능이 늘어나기는 하지만 단조 증가 X
때문에 적절한 수의 문서를 선택하는 것이 중요함
- 너무 적은 수의 candidate는 충분한 정보를 제공하지 못함
- 너무 많은 수의 candidate는 무관한 정보를 제공함으로써 오히려 성능을 저하시킬 수 있음

candidate augmentation을 하는 것이 다양한 검색을 해오는 데 도움
→ 이는 더 개인화되고 문맥적으로 풍부한 답변을 생성할 수 있게끔 함

stick-to-it-iveness