Unified-MAS: Universally Generating Domain-Specific Nodes for Empowering Automatic Multi-Agent Systems
作者: Hehai Lin, Yu Yan, Zixuan Wang, Bo Xu, Sudong Wang, Weiquan Huang, Ruochen Zhao, Minzhi Li, Chengwei Qin
分类: cs.AI
发布日期: 2026-03-23
备注: Code is available at https://github.com/linhh29/Unified-MAS
💡 一句话要点
Unified-MAS:通过通用领域节点生成增强自动多智能体系统
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自动多智能体系统 知识密集型领域 节点生成 离线优化 外部知识检索
📋 核心要点
- 现有自动多智能体系统在知识密集型领域面临挑战,通用节点缺乏专业知识,即时生成节点则受限于LLM的知识和架构耦合。
- Unified-MAS通过离线节点合成解耦节点实现和拓扑编排,利用外部知识生成专业节点蓝图,并优化瓶颈节点的内部逻辑。
- 实验表明,Unified-MAS集成到现有基线后,在四个专业领域实现了高达14.2%的性能提升,并降低了成本,同时具有良好的鲁棒性。
📝 摘要(中文)
自动多智能体系统(MAS)生成已成为解决复杂推理任务的一种有前景的范例。然而,现有的框架在应用于知识密集型领域(如医疗保健和法律)时,从根本上受到瓶颈的限制。它们要么依赖于像思维链这样缺乏专业知识的通用节点静态库,要么试图即时生成节点。在后一种情况下,编排器不仅受到其内部知识限制的约束,还必须同时生成领域特定的逻辑并优化高层拓扑,导致严重的架构耦合,从而降低整体系统效率。为了弥合这一差距,我们提出了Unified-MAS,它通过离线节点合成将细粒度节点实现与拓扑编排解耦。Unified-MAS分两个阶段运行:(1)基于搜索的节点生成,检索外部开放世界知识以合成专门的节点蓝图,克服LLM的内部知识限制;(2)基于奖励的节点优化,利用困惑度引导的奖励来迭代增强瓶颈节点的内部逻辑。在四个专业领域进行的大量实验表明,将Unified-MAS集成到四个自动MAS基线中可以产生更好的性能-成本权衡,实现高达14.2%的增益,同时显着降低成本。进一步的分析表明,它在不同的设计者LLM中具有鲁棒性,并且在传统的数学推理等任务中有效。
🔬 方法详解
问题定义:现有自动多智能体系统在知识密集型领域表现不佳,主要原因是它们依赖于通用节点或尝试即时生成节点。通用节点缺乏领域专业知识,而即时生成节点的方法则面临LLM内部知识的限制以及架构耦合问题,即编排器需要同时处理节点逻辑生成和拓扑优化,导致效率低下。
核心思路:Unified-MAS的核心思路是将节点实现与拓扑编排解耦,通过离线方式预先生成领域相关的专业节点,从而克服LLM的知识限制和架构耦合问题。这种解耦允许系统专注于拓扑优化,而无需同时处理复杂的节点逻辑生成。
技术框架:Unified-MAS包含两个主要阶段:(1)基于搜索的节点生成:利用外部知识库(如搜索引擎、知识图谱等)检索相关信息,并基于检索到的信息合成专门的节点蓝图。这个阶段旨在克服LLM自身的知识限制,为后续的节点优化提供基础。(2)基于奖励的节点优化:识别系统中的瓶颈节点,并使用困惑度引导的奖励函数迭代优化这些节点的内部逻辑。这个阶段旨在提高节点的性能和效率,使其更好地适应特定任务。
关键创新:Unified-MAS的关键创新在于其解耦的设计理念和离线节点合成方法。与现有方法相比,Unified-MAS不再依赖于LLM的内部知识或即时生成节点,而是通过外部知识检索和离线优化来构建专业节点。这种方法有效地解决了知识密集型领域中自动多智能体系统的性能瓶颈。
关键设计:在基于搜索的节点生成阶段,需要选择合适的外部知识源和检索策略,以确保检索到高质量的相关信息。在基于奖励的节点优化阶段,困惑度引导的奖励函数用于评估节点的性能,并指导节点逻辑的迭代优化。具体的奖励函数设计和优化算法的选择会影响最终的节点性能。
🖼️ 关键图片
📊 实验亮点
实验结果表明,将Unified-MAS集成到四个自动MAS基线中,在四个专业领域实现了高达14.2%的性能提升,同时显著降低了成本。此外,该方法在不同的设计者LLM中表现出良好的鲁棒性,并且在传统的数学推理任务中也有效。
🎯 应用场景
Unified-MAS可应用于医疗、法律、金融等知识密集型领域,提升自动多智能体系统在复杂推理任务中的表现。例如,在医疗诊断中,可以生成专业的诊断节点,辅助医生进行更准确的判断。该研究有助于构建更智能、更高效的自动化系统,提高工作效率和决策质量。
📄 摘要(原文)
Automatic Multi-Agent Systems (MAS) generation has emerged as a promising paradigm for solving complex reasoning tasks. However, existing frameworks are fundamentally bottlenecked when applied to knowledge-intensive domains (e.g., healthcare and law). They either rely on a static library of general nodes like Chain-of-Thought, which lack specialized expertise, or attempt to generate nodes on the fly. In the latter case, the orchestrator is not only bound by its internal knowledge limits but must also simultaneously generate domain-specific logic and optimize high-level topology, leading to a severe architectural coupling that degrades overall system efficacy. To bridge this gap, we propose Unified-MAS that decouples granular node implementation from topological orchestration via offline node synthesis. Unified-MAS operates in two stages: (1) Search-Based Node Generation retrieves external open-world knowledge to synthesize specialized node blueprints, overcoming the internal knowledge limits of LLMs; and (2) Reward-Based Node Optimization utilizes a perplexity-guided reward to iteratively enhance the internal logic of bottleneck nodes. Extensive experiments across four specialized domains demonstrate that integrating Unified-MAS into four Automatic-MAS baselines yields a better performance-cost trade-off, achieving up to a 14.2% gain while significantly reducing costs. Further analysis reveals its robustness across different designer LLMs and its effectiveness on conventional tasks such as mathematical reasoning.