Abstract
ReAct = Reason + Act
= 추론 + 실행
추론 과정 : 모델이 행동 계획을 유도, 추적, 업데이트하고 예외를 처리하는 데 도움을 줌
행동 과정 : 모델이 외부 지식 베이스나 환경(예: API)에서 추가 정보를 수집하고 이를 활용
1.추론을 통해 행동(reason to act): 고수준 계획을 생성, 유지, 조정할 수 있음
2.행동을 통해 추론(act to reason): 외부 환경(예: Wikipedia)과 상호작용하여 추가 정보를 추론에 통합할 수 있음
Introduction
REACT: SYNERGIZING REASONING + ACTING
HotPotQA: 두 개 이상의 Wikipedia 문서를 바탕으로 추론해야 하는 멀티홉 질문 응답 벤치마크.
FEVER: 주어진 주장(Claim)이 Wikipedia 문서에 의해 지지(SUPPORTS), 반박(REFUTES) 또는 불충분한 정보(NOT ENOUGH INFO)로 분류되는 사실 검증 벤치마크.
결론 : ReAct는 추론과 행동의 결합을 통해 CoT보다 더 높은 성공 비율을 보이며, 외부 정보와 상호작용할 수 있는 능력이 주요 강점으로 작용,실패 사례는 ReAct와 CoT 모두 복잡한 질문이나 다중 단계 추론에서 주로 발생
https://arize.com/blog/keys-to-understanding-react/
https://introduce-ai.tistory.com/entry/%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-ReAct-SYNERGIZING-REASONING-AND-ACTING-IN-LANGUAGE-MODELS
https://www.youtube.com/watch?v=QX-p-vsDoiQ