MasRouter: Learning to Route LLMs for Multi-Agent Systems

하임·2026년 1월 9일

Routing

목록 보기
27/44

https://arxiv.org/pdf/2502.11133

논문 "MasRouter: Learning to Route LLMs for Multi-Agent Systems"는 LLM 기반 멀티 에이전트 시스템(MAS)의 효율성과 성능을 동시에 높이기 위한 새로운 라우팅 프레임워크인 MasRouter를 제안합니다. 다음은 해당 논문의 주요 내용을 요약한 상세 설명입니다:


🔍 연구 배경과 문제의식

  • 기존 단일 에이전트 LLM 라우팅 방식은 각 쿼리에 대해 적절한 LLM을 선택하여 비용을 절감하고 성능을 향상시키는 데에 효과적이었음.
  • 하지만 Multi-Agent System (MAS)에서는 단순한 LLM 선택 이상의 요소, 즉 협업 모드 결정, 역할 할당, LLM 선택이 결합된 보다 복잡한 라우팅 문제가 존재함.
  • 기존 MAS는 동일한 LLM 백본을 공유하거나, 고정된 에이전트 구조를 사용하여 유연성이 떨어지고, 비용이 많이 들며 확장성에 제약이 있음.

🌐 MasRouter: 제안하는 방법

MasRouter는 MAS 라우팅(MASR)을 다음 세 가지 주요 단계로 구성하여 수행합니다:

1. 협업 모드 결정 (Collaboration Mode Determination)

  • 쿼리의 특성에 따라 Chain, Tree, Graph 등 다양한 협업 구조 중 적합한 것을 선택.
  • Variational Latent Model을 통해 쿼리와 협업 모드 간의 잠재적인 의미 관계를 학습.

2. 에이전트 역할 할당 (Agent Role Allocation)

  • 예: 프로그래머, 수학자, 물리학자, 테스터 등 다양한 역할을 구조적으로 할당.
  • 이전 역할들과의 관계를 고려한 확률적 계단식 구조(probabilistic cascade)를 사용하여 역할을 점진적으로 할당.

3. LLM 라우팅 (Agent LLM Routing)

  • 각 에이전트의 역할과 쿼리 특성에 따라 적절한 LLM을 선택.
  • 멀티노미얼 확률 모델을 기반으로 가장 적합한 LLM을 에이전트에게 매칭.

📊 실험 결과 요약

✅ 성능 (High-Performance)

  • MBPP, MMLU, GSM8K, HumanEval, MATH 등 다양한 벤치마크에서 기존 SOTA 라우팅 기법 대비 최대 8.2% 성능 향상.
  • 특히 HumanEval에서는 기존 RouterDC보다 1.55% 향상된 정확도를 기록.

💰 비용 절감 (Cost Efficiency)

  • HumanEval 기준으로 비용 52.07% 절감, 다른 MAS 구조와 결합 시에도 최대 28.17% 절감.
  • Ablation 실험에서도 LLM 라우팅 모듈이 가장 큰 성능 기여를 한다는 것을 확인.

🔁 범용성 (Plug-and-Play)

  • 기존 MAS 구조(MAD, MacNet 등)에 손쉽게 통합 가능.
  • 새로운 LLM이 추가되어도 재학습 없이도 효과적으로 적응 (e.g. Deepseek-v3 실험 결과).

⚙️ 수식 및 학습 구조

MasRouter는 다음과 같은 최적화 목적 함수를 사용:

min⁡θE(Q,a)∼D,S∼Fθ[−p(a∣Q)+λ⋅C(S;Q)]\min\theta \mathbb{E}{(Q, a) \sim D, S \sim F_\theta}[-p(a|Q) + \lambda \cdot C(S; Q)]

  • 유틸리티와 비용 간의 트레이드오프를 고려하여 쿼리별 최적 MAS를 학습.
  • 학습에는 Policy Gradient 기법을 적용.

📌 주요 기여 요약

  1. MASR 문제 정의: MAS 내에서 협업 모드, 역할, LLM을 모두 고려하는 라우팅 문제를 처음으로 공식화.
  2. MasRouter 제안: 협업-역할-모델 선택을 통합한 고성능, 저비용 라우터 설계.
  3. 광범위한 실험 검증: 다양한 벤치마크와 조합에서 우수한 성능 및 비용 효율성 입증.

🔚 결론

MasRouter는 멀티 에이전트 환경에서 LLM 활용을 최적화하는 최초의 종합적인 라우팅 프레임워크입니다. 성능, 비용, 유연성을 모두 고려한 설계로, 향후 LLM 기반 집단지성 시스템의 자동화 및 확장성 구현에 기여할 수 있는 중요한 발판을 마련합니다.


profile
NLP 공부합니당

0개의 댓글