[정리] '24년 AI Summit : 쉽게 이해하는 RAG와 에이전트 AI 기술의 현재와 미래 - 최윤석

서쿠·2024년 12월 25일
2

'24년 AI SUMMIT-SEOUL

목록 보기
1/2
post-thumbnail

오전 미팅 일정을 마친 후, Day2 오후 세션에 참석하여 매우 유익한 시간을 보냈습니다. 모든 세션에 참가하지 못한 점은 아쉽지만, 참석한 세션들에서 얻은 내용과 인사이트를 중심으로 이번 시리즈를 구성해 보았습니다.

Track C: LLM & GenAI

  • 제목 : 쉽게 이해하는 RAG와 에이전트 AI 기술의 현재와 미래
  • 발표자 : 최윤석 | Tech PM | 마이크로소프트

1. 기술 발전과 AI의 역할

  • 기술 발전의 법칙:
    • 기술은 시간이 지남에 따라 꾸준히 발전해 왔습니다.
    • 컴퓨터 성능은 더욱 빨라지고 데이터 처리 능력도 향상되면서 AI(인공지능)가 실질적인 도움을 제공할 기반이 마련되었습니다.
    • 이러한 발전은 현대의 여러 산업에서 혁신적인 변화를 이끌고 있습니다.

이미지 출처: skhynix 뉴스룸

  • AI의 중요성:

    • AI는 사람의 업무를 보조하거나 복잡한 문제를 효율적으로 해결하는 데 중요한 역할을 하고 있습니다.
    • 의료, 금융, 제조업 등 다양한 분야에서 AI의 도입이 확산되고 있습니다.
      • 예를 들어, 병원에서는 AI가 환자의 상태를 분석하고 진단을 돕는 역할을 하며, 금융업에서는 대규모 데이터를 분석해 리스크를 줄이는 데 사용됩니다. 이러한 사례는 AI가 점차 필수적인 도구로 자리 잡고 있음을 보여줍니다.
      • 제조업에서는 품질 관리와 예측 유지보수를 위해 AI가 사용되고 있으며, 이는 생산성을 극대화하고 불필요한 비용을 줄이는 데 기여하고 있습니다.
  • 변화의 속도:

    • 머신러닝과 딥러닝 기술의 발전은 AI 기술의 비약적인 발전을 가능케 했으며, 몇 년 전에는 상상하지 못했던 일들이 이제 현실화되고 있습니다.
      • 예를 들어, 자연어 처리(NLP) 기술은 인간과 유사한 수준의 언어 이해와 생성 능력을 보여주고 있습니다.

이미지 출처 : 무어의 법칙 - techdaily

  • 무어의 법칙:
    • 반도체 성능이 18~24개월(약 2년) 주기로 두 배로 증가한다는 무어의 법칙은 AI 기술 발전의 중요한 기반이 됩니다.
    • 이러한 발전은 컴퓨팅 파워의 극적인 향상을 가능하게 했으며, 이는 딥러닝과 같은 데이터 집약적인 기술의 핵심 동력으로 작용했습니다.
    • GPU 성능의 급격한 향상은 AI 모델의 스케일링 가능성을 높였으며, 이는 AI가 점점 더 복잡한 문제를 해결하는 데 기여하고 있습니다.

이미지 출처: 뉴스줌

  • GPU와 AI 발전:

    • 하지만!! GPU 성능은 6개월마다 두 배로 증가하고 있으며, 이를 통해 대규모 데이터 세트를 처리하고 복잡한 AI 모델 학습이 가능해졌습니다.
      • 이로 인해 자연어 처리, 이미지 인식, 음성 인식 등 다양한 AI 응용 분야에서 성과가 가속화되었습니다.
      • 대규모 언어 모델(LLM)의 성장은 GPU 기술 발전 없이는 불가능했다고 해도 과언이 아닐 정도로, GPU의 발전은 GPT-4와 같은 고성능 AI 모델이 등장하게 되는게 큰 역할을 수행했습니다.
  • AI 채택 증가:

    • 발표자는 기업 CTO와 CIO의 95% 이상이 AI 프로젝트를 계획 중이라고 강조했습니다. 이는 AI가 비즈니스 운영의 중심으로 자리 잡았으며, 효율성 향상과 새로운 혁신 창출에 기여하고 있음을 보여줍니다.
    • 더 나아가 이러한 수치는 AI가 단순한 보조 도구를 넘어, 기업 경쟁력을 강화하고 업계를 선도하는 데 필수적인 요소로 간주되고 있음을 시사합니다.
    • AI를 도입한 기업들은 시장 변화에 유연하게 대응하며, 데이터 기반의 전략적 의사결정을 통해 지속 가능한 성장을 이루고 있습니다.

2. 더 똑똑해지는 AI

  • LLM(Large Language Model)이란?:
    • LLM(Large Language Model)은 거대 언어 모델로, 자연스럽게 문장을 이해하고 대답할 수 있는 AI를 의미합니다.
    • 이러한 모델은 방대한 데이터와 계산 자원을 활용해 학습하며, 사람과 유사한 수준의 언어 생성 능력을 갖추고 있습니다. GPT-4는 이 분야의 대표적인 예입니다.

이미지 출처: BureauWorks

  • 모델 크기의 중요성:
    • 모델이 커질수록 더 많은 데이터를 학습할 수 있어 정보의 정확성이 높아집니다. GPT-3에서 GPT-4로의 발전은 자연어 처리, 콘텐츠 생성, 번역 등에서 뛰어난 성능을 보여줍니다.
    • GPT-3의 1,750억 파라미터와 비교하여 GPT-4는 수조 개의 파라미터를 가지며, 이는 AI의 정확성과 응답 능력을 획기적으로 향상시켰습니다. 이러한 대규모 파라미터는 더 세밀한 추론과 복잡한 문제 해결을 가능하게 합니다.

이미지 출처: Amatria

  • 채팅 AI의 활용:
    • 많은 사용자가 AI 채팅 시스템을 통해 질문에 답을 얻거나 문제를 해결합니다. 이러한 시스템은 고객 지원, 교육, 건강 상담 등 다양한 분야에서 큰 변화를 가져왔습니다. 특히 사용자 친화적인 인터페이스와 실시간 응답 기능은 사용자 경험을 크게 개선하고 있습니다.
    • 예를 들어, 의료 상담에서는 AI 채팅이 환자의 증상을 분석하고 필요한 정보를 제공함으로써 의료진의 업무를 보조합니다.

이미지 출처: Chat GPT 소개

  • 성능 평가:
    • Chatbot Leaderboard와 같은 벤치마크를 통해 모델의 강점과 약점을 비교하고 분석할 수 있습니다. 사용자는 두 개의 모델이 제공한 답변을 비교해 선호도를 선택하며, 이는 모델 성능 평가의 중요한 기준이 되고 있습니다.
    • 이러한 평가 시스템은 공정성과 객관성을 보장하기 위해 모델명을 숨긴 상태에서 사용자 선택을 기반으로 순위를 매기는 방식을 사용합니다.

이미지 출처: Hugging Face ChatBot Arena

3. 똑똑한 AI의 새로운 도약: Reasoning Native

  • Reasoning Native AI란?:
    • Reasoning Native AI는 단순히 답을 찾는 것을 넘어 깊이 생각하고 문제를 해결하는 능력을 가진 AI입니다.
    • 기존의 단순 회귀나 분류 작업을 넘어서는 복잡한 논리적 추론을 수행할 수 있습니다.

이미지 출처: 애플경제

  • 새로운 가능성:

    • 데이터를 분석하거나 중요한 결정을 내릴 때 Reasoning Native AI는 인간의 사고 방식을 모방하여 보다 정교한 판단을 제공합니다.
      • 예를 들어, 경제 데이터를 기반으로 시장 동향을 예측하거나 법적 문제를 해결하는 데 사용될 수 있습니다.
    • Reasoning Native AI는 IQ 테스트에서 인간 평균을 초과하는 성능을 기록하며, AI가 단순한 계산을 넘어서는 추론 능력을 갖추었음을 보여줍니다.
  • 해결 가능한 문제:

    • 제조업에서는 생산 과정 최적화, 금융업에서는 사기 거래 감지, 의료 분야에서는 복잡한 질병 진단 등 다양한 문제를 효과적으로 해결할 수 있습니다.
    • 이는 AI가 단순히 보조적인 역할에서 벗어나 핵심적인 의사결정을 지원하는 단계로 발전하고 있음을 나타냅니다.

4. RAG 기술이란?

  • RAG의 정의:
    • RAG는 "검색 기반 생성(Retrieval-Augmented Generation)"으로, AI가 실시간으로 여러 문서에서 관련 정보를 검색하고 답을 생성하는 기술입니다.

이미지 출처: Azure AI

  • RAG의 활용:

    • 법률, 의료 등 전문 분야에서 강력한 도구로 사용됩니다.
    • 예를 들어, 법률 회사는 문서 분석에 RAG를 활용하여 방대한 판례와 법률 조항 중 필요한 정보를 신속히 찾을 수 있습니다. 의료 기관에서는 진단 지원 및 치료 계획 수립에 사용됩니다.
  • 특징:

    • 방대한 데이터를 기반으로 신뢰할 수 있는 답을 빠르게 제공합니다. 이를 통해 사용자 질문에 대해 즉각적이고 정확한 답변을 생성할 수 있습니다.
  • 기술적 과정:

    • RAG는 자연어 질문을 벡터로 변환하고, 벡터 공간에서 관련 데이터를 검색하여 가장 관련성 높은 정보를 추출합니다. 이러한 검색과 생성의 조합은 기존의 단순 검색 시스템보다 더 심층적이고 정확한 결과를 제공합니다.
    • 벡터 검색의 주요 원리는 코사인 유사도를 활용하여 사용자의 질문과 가장 연관된 데이터 포인트를 식별하는 것입니다.

5. Agent system과 Multi-modal 기술

💡 LLM에서 AI Agent까지

  • 아래는 Microsoft에서 정의하고 있는 LLM, LLM with Tools, 그리고 AI 에이전트입니다:
  • 출처: https://learn.microsoft.com/ko-kr/azure/databricks/generative-ai/agent-framework/ai-agents
    • LLM: 초기의 대형 언어 모델은 광범위한 학습 데이터셋에서 축적된 지식을 활용해 입력된 프롬프트에 단순히 응답하는 역할을 했습니다.
    • LLM with Tools: 개발자들은 LLM의 기능을 확장하기 위해 하드코딩된 도구를 통합했습니다. 예를 들어, RAG(검색 증강 생성)는 특정 문서 집합을 활용해 LLM의 지식 기반을 강화했으며, API 도구는 지원 티켓 생성이나 이메일 발송 같은 작업을 LLM이 수행할 수 있도록 만들었습니다.
    • AI 에이전트: AI 에이전트는 주어진 문제를 이해하고 이를 바탕으로 스스로 계획을 수립하며 태스크를 실행합니다. AI 에이전트도 여전히 도구를 활용하지만, 어떤 도구를 언제 사용할지는 스스로 결정합니다. 이는 복합 AI 시스템과 비교했을 때 자율성과 의사 결정 능력 측면에서 차별화됩니다.
  • 에이전트 시스템과 오케스트레이션:

    • 에이전트 시스템은 각 에이전트가 고유한 역할을 맡아 협력하는 시스템입니다. 예를 들어, 정보 검색을 담당하는 에이전트, 텍스트 생성을 담당하는 에이전트, 이미지를 처리하는 에이전트 등으로 나뉘어 작업이 이루어집니다.
    • 이를 조율하는 오케스트레이터는 작업 흐름을 관리하고, 에이전트 간의 협업을 최적화하며, 종합적인 결과를 도출합니다. 이러한 오케스트레이션은 복잡한 프로젝트와 다중 작업 환경에서 필수적인 역할을 합니다.
  • 멀티모달과 OmniParser:

    • 멀티모달 AI는 텍스트, 이미지, 오디오와 같은 다양한 데이터를 동시에 처리할 수 있는 AI를 의미합니다. 이를 지원하는 도구 중 하나인 OmniParser는 다양한 스크린 데이터를 분석하고 정리하는 기능을 제공합니다. 예를 들어, 파워포인트 화면을 AI로 분석하여 각 슬라이드에 포함된 텍스트와 이미지를 자동으로 정리하고, 이를 기반으로 발표 요약 자료를 생성할 수 있습니다.

  • OmniParser는 사용자 인터페이스(UI) 스크린샷을 구조적으로 분석하여 GPT-4V와 같은 비전 언어 모델이 다양한 UI 환경에서 작업을 수행할 수 있도록 돕는 기술입니다. 이 도구는 다양한 플랫폼(Windows, macOS, iOS, Android 등)과 애플리케이션(Web 브라우저, 오피스 소프트웨어, 그래픽 편집 프로그램 등)에서의 범용성을 목표로 하고 있습니다.

  • Agentic AI 시스템:

    • Agentic AI 시스템은 각 에이전트가 특정 작업에서 전문성을 발휘할 수 있도록 설계된 시스템입니다. 예를 들어, 정보 검색을 담당하는 에이전트와 생성 작업을 담당하는 에이전트를 조율하여 복잡한 문제를 분할하고 최적화된 해결 과정을 제공합니다. 이러한 시스템은 특히 대규모 프로젝트 관리나 복합 데이터 처리 환경에서 효과적인 결과를 도출하는 데 유용합니다.
    • 의료 현장에서 멀티모달 기술을 활용하여 환자의 MRI 이미지와 의료 기록 데이터를 동시에 분석하고, 에이전트 시스템을 통해 진단과 치료 계획을 제안하는 프로세스를 구현하는 것도 이러한 기술의 한 예입니다.
    • 이러한 기술은 단일 데이터 유형으로는 얻기 힘든 통찰력을 제공하며, AI 활용의 새로운 가능성을 열어줍니다.

결론

AI는 우리의 삶에 실질적 가치를 더하는 강력한 도구입니다. 기술의 올바른 활용과 더불어 책임감 있는 관리가 필요하며, 이는 AI가 인간과 함께 지속적으로 발전해 나가는 데 중요한 역할을 합니다. AI의 발전은 앞으로도 새로운 가능성을 열어가며, 우리의 일상과 비즈니스에서 점점 더 중요한 위치를 차지할 것입니다.

Microsoft의 제품 아이디어는 특히 혁신적이며, RAG와 같은 기술을 더욱 실용적이고 사용자 친화적으로 만드려는 시도는 큰 감명을 주었습니다.

"Copilot Studio for RAG":

이미지 출처 : https://learn.microsoft.com/

  • Microsoft의 Copilot Studio 플랫폼을 활용하여 RAG 시스템을 간편하게 구축할 수 있습니다.
  • 회사 문서나 데이터베이스에서 관련 정보를 검색하고 이를 통합하여 맥락적으로 더욱 정확한 응답을 제공하는 맞춤형 AI 비서를 생성할 수 있습니다.
  • 이러한 접근은 GPT Store와 유사하게, 사용자가 복잡한 프로그래밍 기술 없이도 RAG를 활용할 수 있도록 채팅 인터페이스만으로 구축 가능하게 하는 것을 목표로 하고 있습니다.

앞으로의 AI 기술은 더 똑똑하고, 더 신뢰할 수 있는 방향으로 발전할 것이며, 이를 통해 더욱 풍요로운 세상을 만들어갈 수 있을 것이라고 생각됩니다.

읽어주셔서 감사합니다 ✨

profile
Always be passionate ✨

0개의 댓글