RAG에 대한 고찰

Ash-Hun·2024년 5월 18일

RAG

목록 보기

1/3

Ⅰ. 극도로 발전한 기술은 마법과 다를게 없다..!

안녕하세요! 불과 며칠전에 OpenAI사가 발표한 GPT-4o가 우리에게 또다른 충격을 주었죠. 인공지능 기술에 대한 발전이 굉장히 급격해서 따라가기만으로도 굉장히 벅찬것 같습니다!
다만 문득 그런생각이 들더라구요, OpenAI사와 같은 기업들이 굉장히 임팩트있는 기술들을 선보이면서 대중들의 눈높이도 그에 맞춰지는것 같습니다. 특히나 저는 생성형 AI를 업으로 삼고있는 사람이라 최대한 거시적인 시각에서 바라보고자 하는데요 상대적으로 트렌디한 기술들에 포커싱되면서 타 분야에 대한 관심도가 시들어지는것 같기도 합니다. 씁쓸한면도 없지않아 있더군요..ㅋㅋ
하지만 이럴때야말로 다시한번 재정리를 통해 발전속도에 뒤쳐지지않을 기회라고 생각합니다. 오늘은 현실세계에서 LLM을 잘 사용할 수 있는 기술중 하나인 RAG(Retrieval-Augmented Generation)에 대해 정리해보겠습니다.

Ⅱ. 많은 곳에서 RAG, 레그, 래그 하는이유?

사실 RAG라는 기술이 나온지는 시간이 좀 지났습니다. 요 기술은 Patrick Lewis와 Facebook AI Research 산하 팀이 2020년 발표한 논문인 '지식 집약적 NLP 작업을 위한 검색 증강 생성(Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks)'을 통해 큰 주목을 받았는데요, RAG와 해당 기술에 사용되는 LLM이 무엇인지 먼저 간략하게 설명을 드리려고 합니다.

1. LLM이란?

LLM은 Large Language Model의 약자로, 자연어 처리(NLP)에서 사용되는 인공지능 기술의 한 종류입니다. 대규모 텍스트 데이터를 학습하여 언어의 구조와 의미를 이해하고, 그 학습을 바탕으로 다양한 다운스트림 테스크(텍스트 생성, 번역, 요약, 질문과 답변 등)작업을 할 수 있습니다. 현재는 챗봇, 검색 엔진, 콘텐츠 생성 등 다양한 분야에서 활용되고 있으며, 인간과 유사한 수준의 언어 이해와 생성 능력을 보여주고 있습니다. 하지만 아직까지도 많은 부분을 해결해야 하는 기술이기도 합니다.

LLM은 많은 장점을 가지지만 단점을 가지기도 합니다. 많은 양의 데이터를 기반으로 학습한 만큼 넓은 지식폭을 가지고 응용력도 충분하지만 이 역시 학습 데이터를 기반으로 하기 때문에 데이터에 대한 편향성, Hallucination(할루시네이션)이라고 부르는 거짓정보를 내뱉는 오류, 맥락 이해의 한계, 윤리적 문제 등등 아직 해결되지 않은 내용이 굉장히 많습니다.

2. RAG가 주목받는 이유?

여기서 RAG가 빛을 발할 수 있습니다. LLM과 외부 지식베이스를 이용하여 LLM의 맥락 한계점, 생성능력, 할루시네이션 최소화와 같은 효과를 내보입니다.
즉, RAG는 LLM의 단점을 어느정도 보완하는 하나의 방법론입니다. 근데 이게 왜 주목을 받냐! 외부 데이터 소스를 활용하고 이를 기반으로 텍스트를 생성하기 때문에 사용자의 질문에 보다 정확하고 풍부한 답변을 제공하기 때문입니다.

Ⅲ. 이게 왜 현실세계에 가장 적합할까!

제가 제일 처음 말했죠. "현실세계에서 LLM을 가장 잘 사용할 수 있는 기술 중 하나"라고 말이죠. 왜 그렇게 말을 했냐면 바로 RAG라는 방법론이 가지는 장점때문에 그렇습니다. 저는 그중에서도 Hallucination을 줄여주고 외부의 지식을 참조한다는 점을 강조하고 싶어요. 또한 LLM을 활용하는 기술 특유의 확장성과 응용성도 한몫한다고 생각합니다.

예를들어, 행정분야에서 RAG를 활용한다고 해봅시다.
사람이 많고많은 메뉴얼 페이퍼를 참고해서 메뉴얼 대응을 하는 CS직원의 일을 줄일 수 있지 않을까요? 메뉴얼 페이퍼가 '외부 지식'으로, 이것을 참조한 CS직원의 대응업무를 'LLM'이 하는것이죠.

또 한편으로 교육분야로 시선을 돌려보면 일대일 코칭이라는 말을 들어보신적이 있나요? 전 일대일 코칭이 의미하는 바가 학생과 코치가 개별적으로 마주하여 학생에게 맞춤화된 공부 솔루션을 제공할 수 있어서 좋은것이라 생각이 들었어요. 이것 역시 RAG를 활용해볼 수 있을거라 생각합니다. 학생에게 맞춤 솔루션을 제공하기위한 학생들의 공부 흔적을 '외부 지식'으로, 이것을 참고하여 맞춤형 솔루션을 만들어 제공하는 것이 'LLM'이 하게 되는 것이죠.

이처럼 LLM과 RAG는 현실적인 부분에서 활용가치가 무궁무진한 기술입니다. 다만, 기술자체가 그만한 포텐셜을 가지고 있다는 말이지 실제 적용하기란 또 많은 요소를 고려해야할 거에요. 그것이 생성형 AI를 하시는 분들이 풀어나가야할 숙제라고 생각합니다.

Ⅳ. 생성형 AI Researcher가 바라본 RAG

일부러 기술적인 부분을 최대한 배제하고 작성해보았는데요. 저도 연차가 얼마되지 않아 많이 배우고 성장해나가는 과정에서 제 주장이 곁들어진 글이 된것 같습니다ㅎㅎ 참고만 하시면 좋을 것 같아요. 저의 경우엔 학술적으로 혹은 기술적인 발전도 중요하지만 그만큼 현업에서 응용할 수 있는 부분도 중요하다고 생각합니다. 저는 기술은 적절하게 응용되고 집약되어 현실세계의 문제해결을 위할 때 큰 가치가 생긴다고 생각하거든요. 그래서 그런지 어느정도 비즈니스 관점에서 바라보는것과도 결이 맞지 않을까 생각이 드네요.

현재도 RAG와 LLM이 결합된 것에 많은 회사들이 열광하고 있는데요, 개인적인 견해로는 현재는 RAG와 LLM, 그 다음에는 RAG를 기반으로 한 Agent, 그 너머에는 고도화된 LLM과 Agent가 합쳐진 Compound AI System이 가장 현실적으로 구현하고 적용할 수 있는 방향성이 아닌가 싶습니다.

제가 또 리뷰할 건데 Compound AI System에 대해 관심이 생기신다면 한번 찾아보셔도 좋을 것 같아요😁 굉장히 가슴뛰는 내용이더라구요ㅎㅎ

기술의 발전을 이끌어 나가는 분들도 굉장히 대단하시고 저처럼 이를 응용한 분야에 관심을 가지는 많은분들을 존경합니다. 어느한쪽이 급격한 발전을 이루는것 보단 기술의 발전과 현실세계로의 적용이 적절한 조화를 이루는 게 가장 베스트라고 생각됩니다! 저 역시 이를 위해 부단히 노력해볼게요.

개인견해가 담긴글이지만 끝까지 읽으신 분들껜 감사드리고 종종 포스팅하겠습니다!

Ash-Hun

Deep Burst 🔥🔥🔥

다음 포스트