LightPlanner: Unleashing the Reasoning Capabilities of Lightweight Large Language Models in Task Planning

📄 arXiv: 2503.08508v2 📥 PDF

作者: Weijie Zhou, Manli Tao, Chaoyang Zhao, Honghui Dong, Ming Tang, Jinqiao Wang

分类: cs.RO

发布日期: 2025-03-11 (更新: 2025-10-24)

备注: The 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2025)


💡 一句话要点

LightPlanner通过参数化函数调用和分层推理,提升轻量级LLM在复杂任务规划中的性能。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 任务规划 轻量级LLM 参数化动作 分层推理 机器人控制 边缘计算 语义推理

📋 核心要点

  1. 轻量级LLM在机器人任务规划中面临挑战,尤其是在涉及动态语义逻辑推理的复杂任务中,性能表现不佳。
  2. LightPlanner通过参数化函数调用实现细粒度的技能控制,并采用分层深度推理确保动作执行、语义解析和参数生成的正确性。
  3. 实验结果表明,LightPlanner在参数量最小的情况下,实现了最高的任务成功率,并在空间语义推理任务中超越了ReAct。

📝 摘要(中文)

本文提出了一种名为LightPlanner的任务规划器,旨在提升轻量级大语言模型(LLM)在复杂任务规划中的性能,充分利用其推理能力。与使用固定技能模板的传统规划器不同,LightPlanner通过参数化函数调用控制机器人动作,动态生成参数值,从而实现精细的技能控制,提高复杂场景下的任务规划成功率。此外,引入了分层深度推理,在每个动作决策步骤之前,LightPlanner会全面考虑动作执行(反馈验证)、语义解析(目标一致性验证)和参数生成(参数有效性验证)三个层次,确保后续动作控制的正确性。同时,加入记忆模块存储历史动作,减少上下文长度,提高长期任务的规划效率。LightPlanner-1.5B模型在包含40,000个动作控制的LightPlan-40k数据集上进行训练,该数据集涵盖了2到13个动作步骤的任务。实验表明,该模型在参数量最小的情况下实现了最高的任务成功率。在涉及空间语义推理的任务中,成功率超过ReAct 14.9%。此外,还展示了LightPlanner在边缘设备上运行的潜力。

🔬 方法详解

问题定义:现有任务规划方法通常使用固定的技能模板,难以适应复杂和动态的环境。轻量级LLM虽然适合边缘部署,但在复杂任务规划中,由于推理能力有限,表现不佳。因此,需要一种能够充分利用轻量级LLM推理能力,并能灵活适应复杂环境的任务规划方法。

核心思路:LightPlanner的核心思路是通过参数化函数调用来控制机器人动作,从而实现更细粒度的技能控制。此外,引入分层深度推理,在每个动作决策步骤前,对动作执行、语义解析和参数生成进行验证,确保动作的正确性和一致性。通过记忆模块存储历史动作,减少上下文长度,提高长期任务的规划效率。

技术框架:LightPlanner的整体框架包括以下几个主要模块:1) 参数化动作生成器:负责生成带有参数的动作指令。2) 分层深度推理模块:包含动作执行验证、语义解析验证和参数有效性验证三个层次。3) 记忆模块:用于存储历史动作,减少上下文长度。整个流程是,首先由参数化动作生成器生成动作指令,然后通过分层深度推理模块进行验证,如果验证通过,则执行该动作,并将该动作存储到记忆模块中。

关键创新:LightPlanner的关键创新在于:1) 使用参数化函数调用代替固定技能模板,实现更灵活的动作控制。2) 引入分层深度推理,确保动作的正确性和一致性。3) 使用记忆模块减少上下文长度,提高长期任务的规划效率。与现有方法相比,LightPlanner能够更好地利用轻量级LLM的推理能力,并能更好地适应复杂和动态的环境。

关键设计:LightPlanner-1.5B模型在LightPlan-40k数据集上进行训练,该数据集包含40,000个动作控制,涵盖了2到13个动作步骤的任务。分层深度推理模块的具体实现细节未知,但其核心思想是在每个动作决策步骤前,对动作执行、语义解析和参数生成进行验证。记忆模块的具体实现细节也未知,但其核心思想是存储历史动作,减少上下文长度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

LightPlanner-1.5B模型在LightPlan-40k数据集上进行了实验,结果表明,该模型在参数量最小的情况下实现了最高的任务成功率。在涉及空间语义推理的任务中,LightPlanner的成功率超过ReAct 14.9%。此外,实验还验证了LightPlanner在边缘设备上运行的潜力,表明其具有良好的可部署性。

🎯 应用场景

LightPlanner可应用于各种需要机器人进行复杂任务规划的场景,例如智能家居、自动驾驶、工业自动化等。该研究的实际价值在于提升了轻量级LLM在机器人任务规划中的性能,使其能够在资源受限的边缘设备上运行,从而降低了部署成本。未来,LightPlanner有望推动机器人技术在更多领域的应用。

📄 摘要(原文)

In recent years, lightweight large language models (LLMs) have garnered significant attention in the robotics field due to their low computational resource requirements and suitability for edge deployment. However, in task planning -- particularly for complex tasks that involve dynamic semantic logic reasoning -- lightweight LLMs have underperformed. To address this limitation, we propose a novel task planner, LightPlanner, which enhances the performance of lightweight LLMs in complex task planning by fully leveraging their reasoning capabilities. Unlike conventional planners that use fixed skill templates, LightPlanner controls robot actions via parameterized function calls, dynamically generating parameter values. This approach allows for fine-grained skill control and improves task planning success rates in complex scenarios. Furthermore, we introduce hierarchical deep reasoning. Before generating each action decision step, LightPlanner thoroughly considers three levels: action execution (feedback verification), semantic parsing (goal consistency verification), and parameter generation (parameter validity verification). This ensures the correctness of subsequent action controls. Additionally, we incorporate a memory module to store historical actions, thereby reducing context length and enhancing planning efficiency for long-term tasks. We train the LightPlanner-1.5B model on our LightPlan-40k dataset, which comprises 40,000 action controls across tasks with 2 to 13 action steps. Experiments demonstrate that our model achieves the highest task success rate despite having the smallest number of parameters. In tasks involving spatial semantic reasoning, the success rate exceeds that of ReAct by 14.9 percent. Moreover, we demonstrate LightPlanner's potential to operate on edge devices.