Language-Augmented Symbolic Planner for Open-World Task Planning

📄 arXiv: 2407.09792v1 📥 PDF

作者: Guanqi Chen, Lei Yang, Ruixing Jia, Zhe Hu, Yizhou Chen, Wei Zhang, Wenping Wang, Jia Pan

分类: cs.RO

发布日期: 2024-07-13

备注: Accepted by Robotics: Science and Systems (RSS) 2024


💡 一句话要点

提出语言增强的符号规划器LASP,解决开放世界任务规划中知识不完备问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 符号规划 开放世界 大型语言模型 任务规划 机器人 知识表示 语言增强

📋 核心要点

  1. 传统符号规划器依赖于完整的领域知识,难以适应开放世界中知识不完备的情况,导致执行错误。
  2. LASP通过集成预训练LLM,利用其推理能力诊断执行错误,并与环境交互学习缺失的知识。
  3. 实验证明LASP在开放世界规划问题中表现出色,即使存在多处知识缺失也能有效解决问题。

📝 摘要(中文)

本文提出了一种语言增强的符号规划器(LASP),旨在使传统符号规划器能够在开放世界环境中运行,解决其对完整领域知识的依赖问题。LASP集成了预训练的大型语言模型(LLM),即使在动作前提条件、对象和属性的初始知识不完整的情况下也能工作。当发生执行错误时,LASP利用LLM基于观察结果诊断错误原因,并与环境交互以逐步构建完成给定任务所需的知识库。实验表明,LASP擅长解决开放世界中的规划问题,即使在知识存在多处缺失的情况下也能表现良好。

🔬 方法详解

问题定义:论文旨在解决开放世界任务规划中,传统符号规划器因依赖完整领域知识而导致的执行错误问题。现有方法难以处理知识不完备的情况,需要人工预先准备完整的领域知识,这在开放世界中是不现实的。

核心思路:论文的核心思路是利用预训练大型语言模型(LLM)的强大推理和泛化能力,弥补符号规划器在知识不完备情况下的不足。LLM可以根据观察到的执行错误,推断出缺失的动作前提条件、对象属性等信息,从而指导规划器进行修正和重新规划。

技术框架:LASP的整体框架包含以下几个主要模块:1) 符号规划器:负责生成初始的任务规划;2) 执行器:执行规划器生成的动作序列;3) 错误检测器:检测执行过程中发生的错误;4) LLM诊断器:利用LLM分析错误原因,并推断缺失的知识;5) 知识更新器:将LLM推断出的知识添加到知识库中,更新规划器的领域模型。整个流程是一个迭代的过程,直到任务成功完成。

关键创新:LASP的关键创新在于将预训练LLM与符号规划器有效结合,利用LLM的语言理解和推理能力来增强符号规划器在开放世界中的适应性。与传统的基于规则或学习的方法相比,LASP无需大量人工标注或训练数据,可以直接利用现有的预训练LLM,具有更强的泛化能力和可扩展性。

关键设计:LLM诊断器的prompt设计是关键。论文可能采用了某种prompt工程方法,例如few-shot learning,来引导LLM进行错误诊断和知识推断。具体的prompt模板和LLM的选择(例如GPT-3, PaLM等)会影响LASP的性能。此外,知识更新器如何将LLM推断出的知识有效地融入到符号规划器的领域模型中也是一个重要的设计细节。具体参数设置和损失函数等细节未知。

📊 实验亮点

论文通过实验验证了LASP在开放世界任务规划中的有效性。具体性能数据未知,但摘要表明LASP即使在知识存在多处缺失的情况下也能表现良好,能够成功解决传统符号规划器无法处理的问题。与没有LLM增强的符号规划器相比,LASP在任务成功率和效率方面应该有显著提升。

🎯 应用场景

LASP可应用于各种需要机器人自主完成复杂任务的开放世界场景,例如家庭服务、仓库管理、自动驾驶等。它能够使机器人在未知环境中自主学习和适应,无需人工预先编程所有可能的场景,大大提高了机器人的智能化水平和应用范围。未来,LASP可以进一步扩展到多智能体协作、人机交互等领域。

📄 摘要(原文)

Enabling robotic agents to perform complex long-horizon tasks has been a long-standing goal in robotics and artificial intelligence (AI). Despite the potential shown by large language models (LLMs), their planning capabilities remain limited to short-horizon tasks and they are unable to replace the symbolic planning approach. Symbolic planners, on the other hand, may encounter execution errors due to their common assumption of complete domain knowledge which is hard to manually prepare for an open-world setting. In this paper, we introduce a Language-Augmented Symbolic Planner (LASP) that integrates pre-trained LLMs to enable conventional symbolic planners to operate in an open-world environment where only incomplete knowledge of action preconditions, objects, and properties is initially available. In case of execution errors, LASP can utilize the LLM to diagnose the cause of the error based on the observation and interact with the environment to incrementally build up its knowledge base necessary for accomplishing the given tasks. Experiments demonstrate that LASP is proficient in solving planning problems in the open-world setting, performing well even in situations where there are multiple gaps in the knowledge.