DyTopo: Dynamic Topology Routing for Multi-Agent Reasoning via Semantic Matching

📄 arXiv: 2602.06039v1 📥 PDF

作者: Yuxing Lu, Yucheng Hu, Xukai Zhao, Jiuxin Cao

分类: cs.AI

发布日期: 2026-02-05


💡 一句话要点

DyTopo:基于语义匹配的动态拓扑多智能体推理框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 动态拓扑 语义匹配 多轮推理 代码生成

📋 核心要点

  1. 现有基于大型语言模型的多智能体系统在多轮推理中表现出潜力,但固定通信模式难以适应迭代问题求解的阶段性需求。
  2. DyTopo通过管理器引导,在每一轮动态构建稀疏通信图,智能体基于轮次目标生成需求和提供描述符,并通过语义匹配确定通信路径。
  3. 实验结果表明,DyTopo在代码生成和数学推理任务上,使用多种LLM作为骨干网络时,均显著优于现有最佳基线方法。

📝 摘要(中文)

本文提出DyTopo,一个由管理器引导的多智能体框架,用于改进多轮推理。现有方法通常采用固定的通信模式,难以适应迭代问题求解中不同阶段的需求。DyTopo在每一轮重建稀疏的有向通信图。基于管理器的轮次目标,每个智能体输出轻量级的自然语言查询(需求)和密钥(提供)描述符。DyTopo嵌入这些描述符并执行语义匹配,仅沿生成的边路由私有消息。在代码生成和数学推理基准测试以及四个LLM骨干网络上,DyTopo始终优于最强的基线(平均+6.2)。除了准确性之外,DyTopo还通过不断演变的图产生可解释的协调轨迹,从而可以对通信路径如何在不同轮次中重新配置进行定性检查。

🔬 方法详解

问题定义:现有基于LLM的多智能体系统在解决复杂推理问题时,通常采用预定义的、静态的通信模式。这种模式无法根据推理过程的不同阶段动态调整智能体之间的信息交流,导致信息传递效率低下,影响整体推理性能。例如,在代码生成任务中,不同智能体可能在不同阶段需要不同的代码片段或调试信息,静态通信无法有效满足这些需求。

核心思路:DyTopo的核心思想是构建一个动态的通信拓扑,该拓扑能够根据当前推理阶段的需求进行自适应调整。通过让智能体表达自己的需求和能力,并利用语义匹配来建立智能体之间的连接,从而实现更高效、更灵活的信息传递。这种动态拓扑结构能够更好地适应复杂推理任务中不断变化的需求。

技术框架:DyTopo框架包含以下几个主要模块:1) 管理器(Manager):负责制定每一轮的推理目标,并将其传递给各个智能体。2) 智能体(Agent):根据管理器设定的目标,生成自然语言描述符,包括“需求(need)”和“提供(offer)”。“需求”描述了智能体当前需要的信息或资源,“提供”描述了智能体能够提供的信息或资源。3) 语义匹配模块:将所有智能体的“需求”和“提供”描述符进行嵌入,并计算它们之间的语义相似度。4) 通信图构建模块:基于语义相似度,构建一个稀疏的有向通信图。只有在语义上相关的智能体之间才会建立连接,允许它们进行私有消息传递。5) 消息传递模块:智能体之间通过构建的通信图进行消息传递,完成信息交流和协同推理。

关键创新:DyTopo的关键创新在于引入了动态拓扑路由机制,该机制能够根据推理过程的实际需求,自适应地调整智能体之间的通信模式。与传统的静态通信模式相比,DyTopo能够更有效地利用有限的通信资源,提高信息传递的效率和准确性。此外,通过可视化动态演变的通信图,可以更好地理解多智能体系统的推理过程和协作模式。

关键设计:在语义匹配模块中,DyTopo使用预训练的语言模型(如Sentence-BERT)将自然语言描述符嵌入到高维向量空间中。然后,通过计算向量之间的余弦相似度来衡量描述符之间的语义相关性。为了构建稀疏的通信图,DyTopo只保留相似度最高的若干个连接,并设置一个阈值来过滤掉不相关的连接。在实验中,作者探索了不同的嵌入模型和相似度阈值,并选择了性能最佳的配置。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,DyTopo在代码生成和数学推理任务上均取得了显著的性能提升。具体而言,在代码生成任务中,DyTopo相比最强的基线方法平均提升了6.2%。在数学推理任务中,DyTopo也取得了类似的提升。此外,实验还验证了DyTopo在不同LLM骨干网络上的有效性,表明该框架具有良好的泛化能力。

🎯 应用场景

DyTopo框架具有广泛的应用前景,可应用于代码生成、数学推理、知识图谱推理、智能对话等多个领域。通过动态调整智能体之间的通信模式,DyTopo能够提高多智能体系统的推理效率和准确性,从而解决更复杂的实际问题。未来,DyTopo还可以与其他技术(如强化学习、知识图谱)相结合,进一步提升多智能体系统的性能和泛化能力。

📄 摘要(原文)

Multi-agent systems built from prompted large language models can improve multi-round reasoning, yet most existing pipelines rely on fixed, trajectory-wide communication patterns that are poorly matched to the stage-dependent needs of iterative problem solving. We introduce DyTopo, a manager-guided multi-agent framework that reconstructs a sparse directed communication graph at each round. Conditioned on the manager's round goal, each agent outputs lightweight natural-language query (need) and \key (offer) descriptors; DyTopo embeds these descriptors and performs semantic matching, routing private messages only along the induced edges. Across code generation and mathematical reasoning benchmarks and four LLM backbones, DyTopo consistently outperforms over the strongest baseline (avg. +6.2). Beyond accuracy, DyTopo yields an interpretable coordination trace via the evolving graphs, enabling qualitative inspection of how communication pathways reconfigure across rounds.