Planning with Multi-Constraints via Collaborative Language Agents

📄 arXiv: 2405.16510v4 📥 PDF

作者: Cong Zhang, Derrick Goh Xin Deik, Dexun Li, Hao Zhang, Yong Liu

分类: cs.AI, cs.CL, cs.LG

发布日期: 2024-05-26 (更新: 2024-12-16)


💡 一句话要点

提出PMC:一种基于协作语言代理的多约束规划方法,显著提升复杂任务成功率。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多约束规划 大型语言模型 多智能体系统 任务分解 零样本学习

📋 核心要点

  1. 现有方法难以处理具有多重约束的复杂任务,尤其是在需要组合长链异构动作时,难以确定可行或最优的动作序列。
  2. PMC方法将复杂任务分解为子任务层级,利用协作的LLM智能体系统,简化了带约束的任务规划,并将子任务映射为可执行的动作。
  3. 实验表明,PMC在TravelPlanner和API-Bank等约束密集型任务上显著优于GPT-4等基线模型,验证了其有效性,并展示了与小型LLM协同工作的能力。

📝 摘要(中文)

本文提出了一种名为“多约束规划(PMC)”的零样本方法,用于基于大型语言模型(LLM)的协作多智能体系统。该方法通过将具有约束的复杂任务分解为一系列子任务层级来简化规划过程,然后将每个子任务映射为可执行的动作。PMC在两个约束密集型基准测试(TravelPlanner和API-Bank)上进行了评估。实验结果表明,PMC在TravelPlanner上的平均成功率达到42.68%,远高于GPT-4(2.92%),并且在API-Bank上优于使用ReAct的GPT-4 13.64%,展示了LLM与多智能体系统集成的巨大潜力。此外,PMC也能与小型LLM(如LLaMA-3.1-8B)协同工作。

🔬 方法详解

问题定义:现有方法在处理具有多个约束条件的复杂任务规划时面临挑战。尤其是在需要组合长链异构动作的情况下,找到满足所有约束条件的可行或最优动作序列非常困难。这限制了LLM智能体在实际应用中的能力。

核心思路:PMC的核心思想是将复杂的、带有约束的任务分解为一系列更小的、更易于管理的子任务。通过分层分解,每个子任务的约束条件变得更加明确,从而更容易找到满足约束的动作序列。此外,PMC利用协作的多智能体系统,每个智能体负责解决特定的子任务,从而提高整体规划效率和成功率。

技术框架:PMC的技术框架包含以下几个主要阶段:1) 任务分解:将原始任务分解为一系列子任务,形成一个层级结构。2) 智能体分配:将每个子任务分配给一个或多个LLM智能体。3) 子任务规划:每个智能体利用LLM的推理能力,为分配到的子任务生成可执行的动作序列。4) 动作执行与反馈:执行生成的动作序列,并根据执行结果进行反馈和调整。5) 结果整合:将各个子任务的结果整合起来,形成最终的解决方案。

关键创新:PMC的关键创新在于其分层分解和协作多智能体的结合。通过分层分解,降低了单个智能体需要处理的复杂性,使得LLM能够更好地利用其推理能力。协作多智能体系统允许并行处理多个子任务,提高了整体规划效率。此外,PMC是一种零样本方法,无需针对特定任务进行训练,具有良好的泛化能力。

关键设计:PMC的关键设计包括:1) 子任务分解策略:如何将原始任务分解为合适的子任务,需要考虑子任务的粒度和依赖关系。2) 智能体协作机制:如何协调多个智能体之间的工作,确保它们能够有效地协同完成任务。3) 动作执行与反馈机制:如何将LLM生成的动作序列转化为可执行的指令,并根据执行结果进行反馈和调整。这些设计细节会影响PMC的性能和鲁棒性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,PMC在TravelPlanner上的平均成功率达到42.68%,显著高于GPT-4的2.92%。在API-Bank上,PMC也优于使用ReAct的GPT-4 13.64%。这些结果表明,PMC在处理约束密集型任务时具有显著优势。此外,实验还证明了PMC可以与小型LLM(如LLaMA-3.1-8B)协同工作,降低了对计算资源的需求。

🎯 应用场景

PMC方法具有广泛的应用前景,例如智能旅游规划、自动化API调用、供应链管理、智能家居控制等。通过将复杂任务分解为子任务,并利用LLM智能体的推理能力,PMC可以帮助用户更高效地完成各种任务,提高生产效率和生活质量。未来,PMC可以进一步扩展到更多领域,例如医疗诊断、金融分析等,为各行各业带来智能化解决方案。

📄 摘要(原文)

The rapid advancement of neural language models has sparked a new surge of intelligent agent research. Unlike traditional agents, large language model-based agents (LLM agents) have emerged as a promising paradigm for achieving artificial general intelligence (AGI) due to their superior reasoning and generalization capabilities. Effective planning is crucial for the success of LLM agents in real-world tasks, making it a highly pursued topic in the community. Current planning methods typically translate tasks into executable action sequences. However, determining a feasible or optimal sequence for complex tasks with multiple constraints at fine granularity, which often requires compositing long chains of heterogeneous actions, remains challenging. This paper introduces Planning with Multi-Constraints (PMC), a zero-shot methodology for collaborative LLM-based multi-agent systems that simplifies complex task planning with constraints by decomposing it into a hierarchy of subordinate tasks. Each subtask is then mapped into executable actions. PMC was assessed on two constraint-intensive benchmarks, TravelPlanner and API-Bank. Notably, PMC achieved an average 42.68% success rate on TravelPlanner, significantly higher than GPT-4 (2.92%), and outperforming GPT-4 with ReAct on API-Bank by 13.64%, showing the immense potential of integrating LLM with multi-agent systems. We also show that PMC works with small LLM as the planning core, e.g., LLaMA-3.1-8B.