
개인적으로는 이제 조금 익숙해진 개념들인데, 어제 대학원 수업을 들으면서 여전히 개념들이 혼동되어 사용되고 있다는 생각에 간단하게나마 다시 정리하고자 한다.
그 전에, 이 블로그에서는 올해 1월 Google, Anthropic 등의 회사에서 발간한 문서들을 기반으로 Agentic RAG의 개념을 한 차례 정리한 적이 있고, 6월에는 Agentic AI와 AI Agents의 차이를 정리한 논문을 리뷰했었다. 이 내용들을 기반으로 이해하고 있는 내용을 다시 이 글에 적었다.
본인이 정리한 블로그 글 링크와 관련 문서는 모두 정리해서 하단에 첨부하도록 하겠다.
쟁점이 되는 개념은 다음과 같다.
우선 여기서 언급되는 Model은 LLM을 포함하여 대규모 데이터를 기반으로 학습된 상태를 의미한다. 이때 LLM을 포함한다고 표현한 이유는 이미지나 영상같은 multi-modal을 처리하는 경우도 모델이기 때문에 포괄적인 의미로 해석할 수 있다.
(1) Model과 Agents의 가장 큰 차이점은 Agents는 '스스로 필요한 workflow와 tool을 찾고, Reasoning과 Planning을 통해 일정 수준의 자율적 판단을 할 수 잇는 상태'로 정의할 수 있지만, LLM은 별도의 지시사항 없이는 추론(finetuning이나 posttraining 등을 통해 내부적 추론이 가능한 모델들도 있지만, 이를 제외한 고차원적인 Planning Skill을 의미함)과 외부 도구를 사용하지 못한다.
(2) AI Agents와 Agents는 동일어로 해석할 수 있고, Agentic AI와 AI Agents(=Agents)의 차이의 핵심은 'Multi-Agents' 구조에 있다. 즉, Agentic AI는 다중 Agents 기반의 협업과 자율성이 강조되는 시스템으로, 단일 Agents 보다 한 단계 고차원적인 개념으로 이해할 수 있다.
(3) 마지막으로, Agentic RAG는 기존의 RAG와 어떤점이 다른지와 Agentic AI와의 관계, 이 두개에 포커스를 두고 이해하면 된다. 우선 기본 전제로, Agentic RAG에서 사용하는 단일 도구는 Agents 시스템(위에서 정의한 개념으로 이해하면 됨)이 아닌, 하나의 down-stream task만을 수행하는 경우만 생각하겠다. 예를 들어, 'Web Search'나 'Code Processor', 'Image Processor' 를 포함해서 프롬프트를 기반으로 최적화한 또 다른 LLM 모델도 모두 하나의 역할을 수행하는 도구가 된다. 이때, 일반적인 block 단위나 workflow 단위의 RAG들은 모두 정해진 규칙과 플로우에 의해서 진행된다는 것과 달리, Agentic RAG은 이 모든 과정을 LLM이 직접, 자율적으로 관리한다는 특징이 있다.
(2+3) 추가로, 만약 Agentic RAG 시스템에서 전제를 바꿔서 단일 도구가 하나의 Agents가 된다면, 이건 Multi Agents 시스템이 되므로, 'Agentic AI system' 으로도 볼 수 있다. Agentic AI는 RAG 뿐만 아니라, 실제로 작업을 수행하는 범위까지 포함하므로(e.g. 에어컨 온도를 직접 높이는 작업) 더 넓은 개념이다.
한편, Agents의 가장 큰 특징인 '자율성'의 수준이나 정도를 어떤 관점에서 보냐에 따라서 이 구분이 조금씩 달라질 수 있다. 현재 시점에서는 OpenAI, Anthropic, Google 등과 같은 굵직한 기업들이 정의한 개념들을 기반으로 어느 정도 구분이 되는 상태이고, 이 글 역시 해당 문서들을 기반으로 한다.