‼️ 개인 학습 내용으로, 오류가 있을 수 있습니다.
논문 URL - https://arxiv.org/abs/2310.11511
Despite their remarkable capabilities, large language models (LLMs) often produce responses containing factual inaccuracies due to their sole reliance on the parametric knowledge they encapsulate.
-> LLM은 비록 뛰어난 능력을 지니고 있지만, 내부적으로 내포하고 있는 파라미터적 지식에만 의존하기 때문에, 부정확한 답변을 자주 생성한다.
Retrieval-Augmented Generation (RAG), an ad hoc approach that augments LMs with retrieval of relevant knowledge, decreases such issues.
-> 언어 모델에 관련 지식을 검색하여 추가하는 임시적 방법인 검색 기반 생성(RAG)은 위와 같은 문제를 완화시킨다.
However, indiscriminately retrieving and incorporating a fixed number of retrieved passages, regardless of whether retrieval is necessary, or passages are relevant, diminishes LM versatility or can lead to unhelpful response generation.
-> 검색이 필요하지 않거나, 검색된 구절이 관련이 없을 때에도 일정한 수의 구절을 무조건적으로 가져와 사용하면, 언어 모델의 활용도가 줄어들거나 쓸모없는 답변을 만들 수 있다.
We introduce a new framework called Self-Reflective Retrieval-Augmented Generation (SELF-RAG) that enhances an LM’s quality and factuality through retrieval and self-reflection.
-> 우리는 검색과 자기 성찰을 통해 언어 모델(LM)의 품질과 사실성을 향상시키는 새로운 프레임워크인 Self-Reflective Retrieval-Augmented Generation(SELF-RAG)을 소개한다.
Our framework trains a single arbitrary LM that adaptively retrieves passages on-demand, and generates and reflects on retrieved passages and its own generations using special tokens, called reflection tokens.
-> 우리의 프레임워크는 하나의 임의의 언어 모델(LM)을 훈련시켜서, 필요할 때마다 지문을 적응적으로 검색하고, 검색된 지문과 자신이 생성한 내용을 특수 토큰(반성 토큰, reflection tokens)을 사용해 생성 및 평가한다.
Generating reflection tokens makes the LM controllable during the inference phase, enabling it to tailor its behavior to diverse task requirements.
-> 반성 토큰(reflection tokens)을 생성함으로써 언어 모델(LM)은 추론 단계에서 제어가 가능해지며, 다양한 작업 요구사항에 맞게 행동을 조정할 수 있다.
Experiments show that SELF-RAG (7B and 13B parameters) significantly outperforms state-of-the-art LLMs and retrieval-augmented models on a diverse set of tasks.
-> 실험 결과, 7B 및 13B 파라미터를 가진 SELF-RAG는 다양한 작업에서 최신 LLM 및 검색-증강 모델을 크게 능가하는 성능을 보인다.
Specifically, SELF-RAG outperforms ChatGPT and retrieval-augmented Llama2-chat on Open-domain QA, reasoning and fact verification tasks, and it shows significant gains in improving factuality and citation accuracy for long-form generations relative to these models.
-> 구체적으로, Self-RAG는 오픈 도메인 질의응답(Open-domain QA), 추론, 그리고 사실 검증 과제에서 ChatGPT와 검색이 추가된 Llama2-chat보다 뛰어난 성능을 보이며, 이들 모델에 비해 장문 생성에서 사실성과 인용 정확도 향상에 현저한 이점을 보인다.


* ablation : 모델이나 알고리즘의 구성 요소(예: 모듈, 레이어, 하이퍼파라미터, 특정 기능 등)를 실험적으로 제거하는 행위를 의미한다.

