PRISM: A Principled Framework for Multi-Agent Reasoning via Gain Decomposition
作者: Yiming Yang, Zhuoyuan Li, Fanxiang Zeng, Hao Fu, Yue Liu
分类: cs.AI
发布日期: 2026-02-09
💡 一句话要点
PRISM:一种基于增益分解的多智能体推理原则性框架
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多智能体推理 大型语言模型 增益分解 探索-信息-聚合 原则性框架
📋 核心要点
- 现有方法缺乏对多智能体推理增益的原则性指导,难以理解其优于单智能体的原因和关键设计选择。
- PRISM框架将多智能体推理增益分解为探索、信息和聚合三个维度,并设计相应机制最大化这些维度。
- 实验表明,PRISM在数学推理、代码生成和函数调用等任务上,以更高的计算效率实现了SOTA性能。
📝 摘要(中文)
多智能体协作已成为增强大型语言模型(LLM)推理能力的一种有前景的范例。然而,现有方法在很大程度上仍然是启发式的,缺乏对性能提升的驱动因素以及如何系统地优化多智能体推理的原则性指导。具体而言,多智能体协作优于单智能体推理的原因,以及哪些设计选择对这些增益贡献最大,仍然不清楚,这使得构建更好的系统变得困难。我们通过引入一个统一的理论框架来解决这一差距,该框架将多智能体推理增益分解为三个概念上独立的维度:用于多样化解决方案覆盖的探索、用于高保真反馈的信息和用于原则性共识的聚合。通过这个视角,现有的方法可以被理解为仅优化这些维度子集的特殊情况。在此分解的基础上,提出了一种名为PRISM(用于多智能体推理的提议-审查-整合合成)的新框架,该框架通过基于角色的多样性、具有基于证据的交叉评估的执行基础反馈以及具有闭环验证的迭代合成来共同最大化所有三个维度。在数学推理、代码生成和函数调用基准上的大量实验表明,与优化部分维度的方法相比,PRISM以卓越的计算效率实现了最先进的性能。该理论框架为未来的多智能体推理系统提供了可操作的设计原则。
🔬 方法详解
问题定义:论文旨在解决多智能体推理中缺乏理论指导的问题。现有方法通常是启发式的,难以解释多智能体协作优于单智能体的原因,以及哪些设计选择对性能提升贡献最大。这阻碍了多智能体推理系统的进一步优化和发展。
核心思路:论文的核心思路是将多智能体推理的增益分解为三个关键维度:探索(Exploration)、信息(Information)和聚合(Aggregation)。通过分别优化这三个维度,可以更有效地提升多智能体推理的性能。这种分解提供了一个原则性的框架,用于理解和改进现有的多智能体推理方法。
技术框架:PRISM框架包含三个主要阶段,对应于增益分解的三个维度: 1. 提议(Propose):通过基于角色的多样性,鼓励智能体探索不同的解决方案,从而最大化探索维度。 2. 审查(Review):通过执行基础的反馈和基于证据的交叉评估,提供高保真的信息,从而最大化信息维度。 3. 整合(Integrate):通过迭代合成和闭环验证,实现智能体之间的原则性共识,从而最大化聚合维度。
关键创新:PRISM的关键创新在于提出了一个统一的理论框架,将多智能体推理增益分解为三个可解释的维度。这与现有方法不同,现有方法通常只关注部分维度,缺乏全面的优化策略。PRISM通过联合优化这三个维度,实现了更优的性能和更高的计算效率。
关键设计: * 角色分配:为每个智能体分配不同的角色,鼓励探索不同的解决方案。 * 证据收集:要求智能体提供支持其推理过程的证据,用于交叉评估。 * 交叉评估:智能体之间互相评估彼此的解决方案和证据,提供反馈。 * 迭代合成:通过多轮提议、审查和整合,逐步改进解决方案。 * 闭环验证:对最终解决方案进行验证,确保其正确性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,PRISM在数学推理、代码生成和函数调用等任务上均取得了SOTA性能。例如,在某些基准测试中,PRISM的性能超过了现有方法10%以上,同时计算效率更高。这验证了PRISM框架的有效性和优越性。
🎯 应用场景
PRISM框架可应用于各种需要复杂推理和协作的场景,例如:软件开发(代码生成、调试)、科学研究(假设验证、实验设计)、金融分析(风险评估、投资决策)等。该框架能够提升LLM在这些领域的应用能力,并为构建更智能、更高效的AI系统提供理论指导。
📄 摘要(原文)
Multi-agent collaboration has emerged as a promising paradigm for enhancing reasoning capabilities of Large Language Models (LLMs). However, existing approaches remain largely heuristic, lacking principled guidance on what drives performance gains and how to systematically optimize multi-agent reasoning. Specifically, it remains unclear why multi-agent collaboration outperforms single-agent reasoning and which design choices contribute most to these gains, making it difficult to build better systems. We address this gap by introducing a unified theoretical framework that decomposes multi-agent reasoning gains into three conceptually independent dimensions: Exploration for diverse solution coverage, Information for high-fidelity feedback, and Aggregation for principled consensus. Through this lens, existing methods can be understood as special cases that optimize only subsets of these dimensions. Building upon this decomposition, a novel framework called PRISM (Propose-Review-Integrate Synthesis for Multi-agent Reasoning) is proposed, which jointly maximizes all three dimensions through role-based diversity, execution-grounded feedback with evidence-based cross-evaluation, and iterative synthesis with closed-loop validation. Extensive experiments across mathematical reasoning, code generation, and function calling benchmarks demonstrate that PRISM achieves state-of-the-art performance with superior compute-efficiency compared to methods optimizing partial dimensions. The theoretical framework provides actionable design principles for future multi-agent reasoning systems.