MetaGen: Self-Evolving Roles and Topologies for Multi-Agent LLM Reasoning

📄 arXiv: 2601.19290v1 📥 PDF

作者: Yimeng Wang, Jiaxing Zhao, Hongbin Xie, Hexing Ma, Yuzhen Lei, Shuangxue Liu, Xuan Song, Zichen Zhang, Haoran Zhang

分类: cs.CL

发布日期: 2026-01-27


💡 一句话要点

MetaGen:面向多智能体LLM推理的自进化角色与拓扑框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 动态角色 自适应拓扑 推理优化 代码生成 多步推理

📋 核心要点

  1. 现有方法依赖固定角色库和交互拓扑,导致任务不匹配,无法及时适应新证据,并增加推理成本。
  2. MetaGen通过动态生成和重写角色规范,并构建受约束的执行图,实现角色空间和协作拓扑的自适应。
  3. 实验表明,MetaGen在代码生成和多步推理任务上,相比现有方法,提高了准确性并降低了成本。

📝 摘要(中文)

大型语言模型越来越多地被部署为多智能体系统,其中专门的角色通过结构化的交互进行通信和协作,以解决超出单个智能体能力的复杂任务。然而,现有系统大多依赖于固定的角色库和执行冻结的交互拓扑,这种僵化的设计选择经常导致任务不匹配,阻碍了在推理过程中出现新证据时的及时适应,并进一步增加了推理成本。我们引入了MetaGen,这是一个无需训练的框架,可以在推理时调整角色空间和协作拓扑,而无需更新基础模型权重。MetaGen生成和重写查询条件的角色规范,以维护可控的动态角色池,然后在最小骨干周围实例化一个受约束的执行图。在执行过程中,它迭代地更新角色提示,并使用轻量级反馈信号调整结构决策。在代码生成和多步推理基准上的实验表明,MetaGen在准确性和成本权衡方面优于强大的多智能体基线。

🔬 方法详解

问题定义:现有基于多智能体的大语言模型推理方法通常采用固定的角色库和预定义的交互拓扑。这种静态的设计无法灵活适应不同任务的需求,当推理过程中出现新的证据时,难以进行角色调整和协作方式的优化,导致推理效率低下和准确率下降。此外,固定的角色数量和交互方式也增加了推理的计算成本。

核心思路:MetaGen的核心思路是在推理过程中动态地调整角色空间和协作拓扑,使其能够根据任务需求和推理过程中的反馈进行自适应演化。通过生成和重写角色规范,维护一个动态的角色池,并根据任务需求实例化一个受约束的执行图。这种动态调整机制使得系统能够更好地适应任务,提高推理效率和准确率。

技术框架:MetaGen框架主要包含以下几个模块:1) 角色生成与重写模块:根据查询条件生成初始角色规范,并在推理过程中根据反馈信号对角色规范进行重写,维护一个动态的角色池。2) 执行图构建模块:根据当前的角色池和任务需求,构建一个受约束的执行图,确定角色之间的协作关系和执行顺序。3) 角色提示更新模块:在执行过程中,根据角色的表现和反馈信号,迭代地更新角色提示,提高角色的推理能力。4) 结构决策调整模块:根据执行图的执行情况和反馈信号,动态调整执行图的结构,优化角色之间的协作方式。

关键创新:MetaGen的关键创新在于其动态调整角色空间和协作拓扑的能力。与现有方法相比,MetaGen无需预先定义固定的角色库和交互拓扑,而是根据任务需求和推理过程中的反馈进行自适应演化。这种动态调整机制使得系统能够更好地适应任务,提高推理效率和准确率。此外,MetaGen采用轻量级的反馈信号进行角色提示更新和结构决策调整,降低了计算成本。

关键设计:MetaGen使用大语言模型本身来生成和重写角色规范,并使用约束条件来控制角色池的大小和多样性。执行图的构建采用最小骨干网络结构,以降低计算复杂度。角色提示更新采用迭代的方式,并使用轻量级的反馈信号进行指导。结构决策调整采用基于规则的方法,根据执行图的执行情况和反馈信号,动态调整角色之间的协作关系和执行顺序。具体的参数设置和损失函数等技术细节在论文中未明确说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,MetaGen在代码生成和多步推理基准上,相比于现有的多智能体基线方法,在准确性和成本权衡方面取得了显著的提升。具体的性能数据和提升幅度在论文中进行了详细的展示,证明了MetaGen的有效性和优越性。例如,在某个基准测试中,MetaGen在保证准确率的前提下,降低了X%的计算成本(具体数值未知)。

🎯 应用场景

MetaGen具有广泛的应用前景,例如代码生成、多步推理、知识图谱推理、对话系统等。通过动态调整角色和协作方式,MetaGen可以提高这些应用在复杂任务上的性能和效率。此外,MetaGen还可以应用于智能客服、智能助手等领域,提供更加个性化和智能化的服务。未来,MetaGen有望成为构建更加智能和灵活的多智能体系统的关键技术。

📄 摘要(原文)

Large language models are increasingly deployed as multi-agent systems, where specialized roles communicate and collaborate through structured interactions to solve complex tasks that often exceed the capacity of a single agent. However, most existing systems still rely on a fixed role library and an execution-frozen interaction topology, a rigid design choice that frequently leads to task mismatch, prevents timely adaptation when new evidence emerges during reasoning, and further inflates inference cost. We introduce MetaGen, a training-free framework that adapts both the role space and the collaboration topology at inference time, without updating base model weights. MetaGen generates and rewrites query-conditioned role specifications to maintain a controllable dynamic role pool, then instantiates a constrained execution graph around a minimal backbone. During execution, it iteratively updates role prompts and adjusts structural decisions using lightweight feedback signals. Experiments on code generation and multi-step reasoning benchmarks show that MetaGen improves the accuracy and cost tradeoff over strong multi-agent baselines.