Orchestrating Intelligence: Confidence-Aware Routing for Efficient Multi-Agent Collaboration across Multi-Scale Models
作者: Jingbo Wang, Sendong Zhao, Jiatong Liu, Haochun Wang, Wanting Li, Bing Qin, Ting Liu
分类: cs.AI
发布日期: 2026-01-08
💡 一句话要点
提出OI-MAS框架,通过置信度感知的路由实现多尺度模型下高效的多智能体协作
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多智能体系统 大型语言模型 模型选择 置信度感知 自适应路由 计算效率 知识推理
📋 核心要点
- 现有MAS框架在所有智能体中统一使用大型LLM,忽略了不同推理阶段的认知需求差异,导致计算效率低下。
- OI-MAS框架通过状态相关的路由机制动态选择智能体角色和模型尺度,并引入置信度感知机制,根据任务复杂度选择模型。
- 实验结果表明,OI-MAS在准确率上提升高达12.88%,同时降低成本高达79.78%,显著优于基线系统。
📝 摘要(中文)
多智能体系统(MAS)在复杂推理任务中表现出优于单智能体方法的性能,但通常存在计算效率低下的问题。现有框架通常在所有智能体角色中统一部署大型语言模型(LLM),而没有考虑到不同推理阶段的不同认知需求。为了解决这种低效问题,我们提出了OI-MAS框架,这是一种新型的多智能体框架,它在异构的多尺度LLM池中实现自适应的模型选择策略。具体来说,OI-MAS引入了一种状态相关的路由机制,该机制在整个推理过程中动态选择智能体角色和模型尺度。此外,我们引入了一种置信度感知的机制,该机制根据任务的复杂性选择合适的模型尺度,从而减少对大型模型的过度依赖。实验结果表明,OI-MAS始终优于基线多智能体系统,在提高高达12.88%准确率的同时,降低高达79.78%的成本。
🔬 方法详解
问题定义:论文旨在解决多智能体系统中计算效率低下的问题。现有方法通常为所有智能体角色分配相同规模的大型语言模型,忽略了不同推理阶段对模型复杂度的不同需求,造成了计算资源的浪费。
核心思路:核心思路是根据当前推理状态和任务复杂度,动态地选择合适的智能体角色和模型尺度。通过这种自适应的模型选择策略,可以避免在简单的推理阶段使用大型模型,从而降低计算成本。置信度感知机制用于评估当前推理结果的可靠性,并据此调整模型选择策略。
技术框架:OI-MAS框架包含以下主要模块:1) 状态编码器:将当前推理状态编码为向量表示。2) 路由机制:根据状态编码选择合适的智能体角色。3) 模型选择器:根据任务复杂度和置信度选择合适的模型尺度。4) 推理引擎:使用选定的智能体角色和模型进行推理。整个流程是循环迭代的,直到达到预定的推理目标或达到最大迭代次数。
关键创新:最重要的创新点在于置信度感知的路由机制。该机制能够根据当前推理状态和任务复杂度,动态地调整智能体角色和模型尺度,从而实现计算效率和推理性能之间的平衡。与现有方法相比,OI-MAS能够更有效地利用计算资源,并在保证推理准确率的同时,显著降低计算成本。
关键设计:状态编码器可以使用各种神经网络结构,例如LSTM或Transformer。路由机制可以使用强化学习或监督学习方法进行训练。模型选择器可以使用分类器或回归器进行训练。置信度可以通过模型输出的概率分布或熵来估计。损失函数可以包括准确率损失和计算成本损失,以平衡推理性能和计算效率。
📊 实验亮点
实验结果表明,OI-MAS框架在多个基准测试中均优于现有的多智能体系统。具体而言,OI-MAS在提高高达12.88%准确率的同时,降低高达79.78%的计算成本。这些结果表明,OI-MAS能够有效地平衡推理性能和计算效率,为多智能体系统的实际应用提供了新的思路。
🎯 应用场景
该研究成果可应用于各种需要多智能体协作的复杂推理任务,例如知识图谱推理、对话系统、自动驾驶等。通过自适应地选择模型尺度,可以显著降低计算成本,使得多智能体系统能够部署在资源受限的设备上。此外,该方法还可以提高推理的鲁棒性,避免过度依赖大型模型。
📄 摘要(原文)
While multi-agent systems (MAS) have demonstrated superior performance over single-agent approaches in complex reasoning tasks, they often suffer from significant computational inefficiencies. Existing frameworks typically deploy large language models (LLMs) uniformly across all agent roles, failing to account for the varying cognitive demands of different reasoning stages. We address this inefficiency by proposing OI-MAS framework, a novel multi-agent framework that implements an adaptive model-selection policy across a heterogeneous pool of multi-scale LLMs. Specifically, OI-MAS introduces a state-dependent routing mechanism that dynamically selects agent roles and model scales throughout the reasoning process. In addition, we introduce a confidence-aware mechanism that selects appropriate model scales conditioned on task complexity, thus reducing unnecessary reliance on large-scale models. Experimental results show that OI-MAS consistently outperforms baseline multi-agent systems, improving accuracy by up to 12.88\% while reducing cost by up to 79.78\%.