One Demo Is All It Takes: Planning Domain Derivation with LLMs from A Single Demonstration

📄 arXiv: 2505.18382v3 📥 PDF

作者: Jinbang Huang, Yixin Xiao, Zhanguang Zhang, Mark Coates, Jianye Hao, Yingxue Zhang

分类: cs.RO

发布日期: 2025-05-23 (更新: 2025-09-25)

备注: 35 pages, 10 figures


💡 一句话要点

提出PDDLLM框架以解决长时间规划的可靠性问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 长时间规划 大型语言模型 任务与运动规划 自动化 机器人技术

📋 核心要点

  1. 现有的任务与运动规划方法在长时间问题上难以保证正确性,且依赖于手动设计的规划领域,限制了自动化程度。
  2. 本文提出的PDDLLM框架通过结合LLM推理与物理仿真,自动从演示中生成符号谓词和动作,减少了人工干预。
  3. 在1200个任务的实验中,PDDLLM的成功率比六个基线方法高出至少20%,并且在多个物理机器人平台上成功部署。

📝 摘要(中文)

预训练的大型语言模型(LLMs)在机器人任务规划中展现出潜力,但在长时间问题上常常难以保证正确性。任务与运动规划(TAMP)通过将符号计划与低级执行相结合来解决这一问题,但依赖于手动设计的规划领域。为提高长时间规划的可靠性并减少人工干预,本文提出了Planning Domain Derivation with LLMs(PDDLLM)框架,该框架通过结合LLM推理与物理仿真,自动从演示轨迹中诱导符号谓词和动作。PDDLLM与以往依赖部分预定义或语言描述的领域推断方法不同,能够在没有手动领域初始化的情况下构建领域,并自动与运动规划器集成,生成可执行计划,从而增强长时间规划的自动化。在1200个任务的九个环境中,PDDLLM的成功率至少提高了20%,并成功在多个物理机器人平台上部署。

🔬 方法详解

问题定义:本文旨在解决长时间规划中的可靠性问题,现有方法依赖手动设计的规划领域,导致自动化程度低且难以保证计划的正确性。

核心思路:PDDLLM框架通过结合大型语言模型的推理能力与物理仿真,自动从演示轨迹中诱导出符号谓词和动作,从而实现无人工干预的领域构建。

技术框架:PDDLLM的整体架构包括三个主要模块:首先是演示轨迹的输入,接着是通过LLM进行符号谓词和动作的自动诱导,最后将生成的领域与运动规划器集成以生成可执行计划。

关键创新:PDDLLM的最大创新在于其能够在没有手动领域初始化的情况下自动构建规划领域,这与以往依赖部分预定义或语言描述的领域推断方法有本质区别。

关键设计:在技术细节上,PDDLLM采用了特定的损失函数来优化符号谓词和动作的生成,并设计了适应性强的网络结构,以便在不同环境中进行有效的规划。

📊 实验亮点

在实验中,PDDLLM在1200个任务的九个环境中表现优异,成功率比六个基线方法高出至少20%,同时减少了令牌成本,并成功在多个物理机器人平台上进行了部署,显示出其强大的实用性和有效性。

🎯 应用场景

该研究的潜在应用领域包括自主机器人、智能制造和服务机器人等,能够显著提高机器人在复杂环境中的任务执行能力,减少人工干预,推动机器人技术的进一步发展与应用。

📄 摘要(原文)

Pre-trained large language models (LLMs) show promise for robotic task planning but often struggle to guarantee correctness in long-horizon problems. Task and motion planning (TAMP) addresses this by grounding symbolic plans in low-level execution, yet it relies heavily on manually engineered planning domains. To improve long-horizon planning reliability and reduce human intervention, we present Planning Domain Derivation with LLMs (PDDLLM), a framework that automatically induces symbolic predicates and actions directly from demonstration trajectories by combining LLM reasoning with physical simulation roll-outs. Unlike prior domain-inference methods that rely on partially predefined or language descriptions of planning domains, PDDLLM constructs domains without manual domain initialization and automatically integrates them with motion planners to produce executable plans, enhancing long-horizon planning automation. Across 1,200 tasks in nine environments, PDDLLM outperforms six LLM-based planning baselines, achieving at least 20\% higher success rates, reduced token costs, and successful deployment on multiple physical robot platforms.