MaCTG: Multi-Agent Collaborative Thought Graph for Automatic Programming

📄 arXiv: 2410.19245v2 📥 PDF

作者: Zixiao Zhao, Jing Sun, Zhe Hou, Zhiyuan Wei, Cheng-Hao Cai, Miao Qiao, Jin Song Dong

分类: cs.SE, cs.CV, cs.MA

发布日期: 2024-10-25 (更新: 2025-04-21)


💡 一句话要点

提出MaCTG,通过多智能体协作图解决自动编程中任务规划低效和幻觉问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自动编程 多智能体系统 协作图 大型语言模型 任务规划 代码生成 混合LLM 图像处理

📋 核心要点

  1. 现有自动编程方法依赖单个LLM或多智能体系统,前者能力有限,后者任务规划低效,易产生级联幻觉。
  2. MaCTG构建动态协作图,实现智能体间精确任务分配和受控协作,减少幻觉错误,提升整体准确性。
  3. 实验表明,MaCTG在图像处理自动编程任务中达到83.33%的SOTA准确率,并降低了89.09%的运营成本。

📝 摘要(中文)

随着大型语言模型(LLMs)的快速发展,基于LLM的方法在各个领域都展现出强大的问题解决能力。然而,在自动编程中,单个LLM通常仅限于函数级别的代码生成,而由多个LLM组成的多智能体系统常常面临任务规划效率低下的问题。这种缺乏结构化协调可能导致级联幻觉,即智能体间累积的错误导致次优的工作流程和过高的计算成本。为了克服这些挑战,我们引入了MaCTG(多智能体协作思想图),这是一种新颖的多智能体框架,它采用动态图结构来促进精确的任务分配和LLM智能体之间的受控协作。MaCTG自主地根据编程需求分配智能体角色,通过上下文感知的调整动态地优化任务分配,并系统地验证和集成项目级别的代码,从而有效地减少幻觉错误并提高整体准确性。MaCTG通过实施混合LLM部署来提高成本效益,其中专有模型处理复杂的推理,而开源模型用于例行编码和验证任务。为了评估MaCTG的有效性,我们将其应用于传统的图像处理自动编程任务,实现了83.33%的最先进准确率。此外,通过利用其混合LLM配置,与现有的多智能体框架相比,MaCTG显著降低了89.09%的运营成本,证明了其效率、可扩展性和实际应用性。

🔬 方法详解

问题定义:论文旨在解决自动编程领域中,传统方法(如单一大语言模型或简单的多智能体系统)在复杂任务规划和代码生成方面存在的不足。单一大语言模型通常只能处理函数级别的代码生成,而多智能体系统则容易出现任务规划效率低下、智能体之间缺乏有效协调以及累积误差导致的“级联幻觉”问题。这些问题导致最终生成的代码质量不高,且计算成本较高。

核心思路:MaCTG的核心思路是构建一个动态的多智能体协作图,通过该图来精确地分配任务、控制智能体之间的协作,并减少幻觉错误的产生。这种方法借鉴了人类团队协作解决复杂问题的模式,将大型编程任务分解为多个子任务,并分配给不同的智能体,同时通过协作图来协调智能体之间的工作,确保任务的顺利完成。

技术框架:MaCTG框架主要包含以下几个关键模块:1) 智能体角色分配模块:根据编程需求自动分配智能体的角色。2) 动态任务分配模块:通过上下文感知的调整动态地优化任务分配。3) 代码验证与集成模块:系统地验证和集成项目级别的代码。4) 混合LLM部署:采用混合LLM配置,专有模型处理复杂的推理,开源模型用于例行编码和验证。整个流程通过动态协作图进行协调,确保各个智能体能够高效地完成各自的任务,并最终生成高质量的代码。

关键创新:MaCTG的关键创新在于其动态协作图的设计,它能够根据任务的进展和智能体的反馈,动态地调整任务分配和协作方式。与传统的静态任务分配方法相比,MaCTG能够更好地适应复杂和变化的任务需求,从而提高整体的效率和准确性。此外,混合LLM部署也是一个重要的创新点,它能够在保证性能的同时,显著降低计算成本。

关键设计:MaCTG的关键设计包括:1) 协作图的构建方式:如何根据任务需求和智能体的能力构建协作图。2) 任务分配策略:如何根据上下文信息动态地调整任务分配。3) 代码验证机制:如何有效地验证和集成各个智能体生成的代码。4) 混合LLM的选择和配置:如何选择合适的专有模型和开源模型,并进行合理的配置。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MaCTG在图像处理自动编程任务中取得了显著的成果,达到了83.33%的最先进准确率,超越了现有的方法。更重要的是,通过采用混合LLM配置,MaCTG将运营成本降低了89.09%,这表明其在保证性能的同时,也具有很高的成本效益。这些实验结果充分证明了MaCTG的有效性、效率和实际应用价值。

🎯 应用场景

MaCTG在自动编程领域具有广泛的应用前景,可以应用于图像处理、自然语言处理、机器人控制等多个领域。它能够帮助开发者更高效地生成高质量的代码,降低开发成本,并加速软件开发过程。此外,MaCTG的混合LLM部署策略也为降低计算成本提供了一种有效的解决方案,使其更具实际应用价值。未来,MaCTG有望成为自动编程领域的重要工具,推动人工智能技术的发展。

📄 摘要(原文)

With the rapid advancement of Large Language Models (LLMs), LLM-based approaches have demonstrated strong problem-solving capabilities across various domains. However, in automatic programming, a single LLM is typically limited to function-level code generation, while multi-agent systems composed of multiple LLMs often suffer from inefficient task planning. This lack of structured coordination can lead to cascading hallucinations, where accumulated errors across agents result in suboptimal workflows and excessive computational costs. To overcome these challenges, we introduce MaCTG (Multi-Agent Collaborative Thought Graph), a novel multi-agent framework that employs a dynamic graph structure to facilitate precise task allocation and controlled collaboration among LLM agents. MaCTG autonomously assigns agent roles based on programming requirements, dynamically refines task distribution through context-aware adjustments, and systematically verifies and integrates project-level code, effectively reducing hallucination errors and improving overall accuracy. MaCTG enhances cost-effectiveness by implementing a hybrid LLM deployment, where proprietary models handle complex reasoning, while open-source models are used for routine coding and validation tasks. To evaluate MaCTG's effectiveness, we applied it to traditional image processing auto-programming tasks, achieving a state-of-the-art accuracy of 83.33%. Additionally, by leveraging its hybrid LLM configuration, MaCTG significantly reduced operational costs by 89.09% compared to existing multi-agent frameworks, demonstrating its efficiency, scalability, and real-world applicability.