Hierarchical Task Network Planning with LLM-Generated Heuristics
作者: Felipe Meneguzzi, Alexandre Buchweitz, Augusto B. Corrêa, Victor Scherer Putrich, André Grahl Pereira
分类: cs.AI
发布日期: 2026-05-08
备注: 9 pages, 3 figures; submitted to NeurIPS 2026
💡 一句话要点
利用LLM生成启发式函数,提升分层任务网络规划效率
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 分层任务网络规划 启发式搜索 大型语言模型 AI规划 自动化任务规划
📋 核心要点
- HTN规划面临的挑战是缺乏像经典规划中那样信息丰富的启发式方法,限制了搜索效率。
- 核心思想是利用大型语言模型(LLM)生成针对HTN规划的启发式函数,以指导搜索过程。
- 实验结果表明,LLM生成的启发式方法在覆盖率上接近最佳HTN规划器,并显著降低搜索成本。
📝 摘要(中文)
分层任务网络(HTN)规划是一种经典规划的变体,它不是搜索线性动作序列,而是使用方法库分解更高级别的任务,直到只剩下可执行的动作。一方面,这允许引入领域知识,通过方法库加速解决方案的搜索。另一方面,它带来了超越经典状态空间搜索的挑战。虽然最近的研究产生了一些启发式方法和新颖算法来加速HTN规划,但这些启发式方法的信息量不如经典规划算法中的启发式方法。我们研究大型语言模型(LLM)是否可以为HTN规划生成有效的搜索启发式方法,将Corrêa, Pereira和Seipp(2025)的方法从经典规划扩展到分层规划。在六个标准的总阶HTN基准领域上使用Pytrich规划器,我们评估了九个LLM在特定领域提示下生成的启发式方法,并将它们与TDG和LMCount领域无关的基线以及PANDA规划器进行了比较。我们的结果表明,LLM生成的启发式方法几乎与最佳可用HTN规划器的覆盖范围相匹配,同时大大减少了83%的共享问题的搜索工作量。
🔬 方法详解
问题定义:HTN规划的搜索效率受限于启发式函数的信息量不足,传统启发式方法难以有效指导任务分解和动作选择,导致搜索空间庞大,求解速度慢。现有方法难以充分利用领域知识,需要人工设计启发式规则,成本高且效果有限。
核心思路:利用大型语言模型(LLM)的强大生成能力,自动生成针对特定HTN规划问题的启发式函数。通过领域相关的提示工程,引导LLM生成具有领域知识的启发式信息,用于评估任务和动作的优先级,从而加速搜索过程。
技术框架:该方法的核心是利用LLM作为启发式函数生成器。首先,针对特定领域,设计合适的提示(Prompt),输入到LLM中。LLM根据提示生成启发式信息,例如评估任务或动作的代价或优先级。然后,将生成的启发式信息集成到HTN规划器(例如Pytrich)中,用于指导搜索过程。规划器根据LLM生成的启发式信息,选择合适的任务分解方法和动作序列,最终找到解决方案。
关键创新:该方法的核心创新在于将LLM应用于HTN规划的启发式函数生成。与传统手工设计启发式函数或使用领域无关的启发式函数相比,该方法可以自动生成针对特定领域的启发式信息,并且可以利用LLM的强大泛化能力,适应不同的HTN规划问题。本质区别在于启发式函数的来源,从人工设计或领域无关的函数转变为LLM自动生成。
关键设计:关键设计包括:1) 提示工程:设计合适的提示,引导LLM生成有用的启发式信息;提示内容需要包含领域知识和问题描述。2) LLM的选择:选择合适的LLM,并根据HTN规划的特点进行微调或优化。3) 启发式信息的集成方式:将LLM生成的启发式信息有效地集成到HTN规划器中,例如作为代价函数的一部分或用于排序任务和动作。
🖼️ 关键图片
📊 实验亮点
实验结果表明,利用LLM生成的启发式函数,Pytrich规划器在HTN benchmark上取得了显著的性能提升,几乎匹配了当前最佳HTN规划器PANDA的覆盖率,并在83%的共享问题上显著降低了搜索开销。表明LLM在HTN规划领域具有巨大的潜力。
🎯 应用场景
该研究成果可应用于各种需要分层任务规划的领域,例如机器人操作、游戏AI、自动化流程设计、供应链管理等。通过自动生成启发式函数,可以降低领域专家的参与度,并提高规划效率,从而加速自动化系统的开发和部署,具有广泛的应用前景。
📄 摘要(原文)
HTN planning is a variation of classical planning where, instead of searching for a linear sequence of actions, an algorithm decomposes higher-level tasks using a method library until only executable actions remain. On one hand, this allows one to introduce domain knowledge that can speed up the search for a solution through the method library. On the other hand, it creates challenges that go beyond those of classical state-space search. While recent research produced a number of heuristics and novel algorithms that speed up HTN planning, these heuristics are not yet as informative as those available in classical planning algorithms. We investigate whether large language models (LLMs) can generate effective search heuristics for HTN planning, extending the methodology of Corrêa, Pereira, and Seipp (2025) from classical to hierarchical planning. Using the Pytrich planner on six standard total-order HTN benchmark domains, we evaluate heuristics generated by nine LLMs under domain-specific prompting and compare them against the TDG and LMCount domain-independent baselines and the PANDA planner. Our results show that LLM-generated heuristics nearly match the coverage of the best available HTN planner, while substantially reducing search effort on 83% of shared problems.