HDFlow: Hierarchical Diffusion-Flow Planning for Long-horizon Tasks

📄 arXiv: 2605.04525v1 📥 PDF

作者: Nandiraju Gireesh, Yuanliang Ju, Chaoyi Xu, Weiheng Liu, Yuxuan Wan, He Wang

分类: cs.RO

发布日期: 2026-05-06

备注: ICML 2026 (Spotlight)


💡 一句话要点

HDFlow:用于长时程任务的分层扩散-流规划框架

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 分层规划 扩散模型 修正流模型 长时程任务 机器人操作

📋 核心要点

  1. 现有生成模型在长时程任务中缺乏分层分解的框架,且迭代去噪过程计算量大,难以实时执行。
  2. HDFlow利用扩散模型生成高层子目标序列,并用修正流模型生成低层平滑轨迹,实现高效分层规划。
  3. 在家具组装等任务上的实验表明,HDFlow显著优于现有方法,并在多种长时程任务中展现了通用性。

📝 摘要(中文)

本文提出了一种新的分层规划框架——分层扩散-流(HDFlow),它优化地利用了扩散模型和修正流模型的优势,以克服单一范式生成规划器的局限性,用于解决长时程、稀疏奖励任务。HDFlow采用高层扩散规划器在学习的潜在空间中生成战略性子目标序列,利用扩散强大的探索能力。这些子目标指导低层修正流规划器生成平滑且密集的轨迹,利用基于常微分方程(ODE)的轨迹生成的速度和效率。在模拟和真实世界的四个具有挑战性的家具组装任务中评估了HDFlow,其性能显著优于最先进的方法。此外,还在包含各种运动和操作任务的两个长时程基准上展示了该方法的一般性。

🔬 方法详解

问题定义:论文旨在解决长时程、稀疏奖励任务中的行为规划问题。现有方法,特别是基于单一生成模型的规划器,通常缺乏有效的分层分解机制,并且由于迭代去噪过程的计算成本,难以满足实时性要求。这些方法在探索复杂环境和生成长期连贯的动作序列方面存在局限性。

核心思路:HDFlow的核心思路是将扩散模型和修正流模型的优势结合起来,构建一个分层规划框架。扩散模型擅长探索高维潜在空间,能够生成多样化的子目标序列;修正流模型则能够高效地生成平滑、密集的轨迹。通过分层规划,HDFlow能够有效地分解复杂任务,并降低计算复杂度。

技术框架:HDFlow包含两个主要模块:高层扩散规划器和低层修正流规划器。首先,高层扩散规划器在学习的潜在空间中生成一系列战略性的子目标。这些子目标作为低层规划器的引导信号。然后,低层修正流规划器基于这些子目标,生成平滑且密集的轨迹。整个框架通过分层的方式,实现了从粗到精的规划过程。

关键创新:HDFlow的关键创新在于其分层扩散-流规划架构。与传统的单一范式生成规划器相比,HDFlow能够更好地利用不同模型的优势,实现更高效、更鲁棒的规划。此外,通过在潜在空间中进行高层规划,HDFlow能够更好地探索复杂环境,并生成长期连贯的动作序列。

关键设计:高层扩散规划器使用标准的扩散模型结构,通过学习潜在空间中的状态表示来生成子目标序列。低层修正流规划器使用基于常微分方程(ODE)的轨迹生成方法,通过求解ODE来生成平滑的轨迹。损失函数包括重构损失、子目标引导损失等,用于训练扩散模型和修正流模型。具体的网络结构和参数设置根据不同的任务进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

HDFlow在四个具有挑战性的家具组装任务(模拟和真实环境)中进行了评估,实验结果表明,HDFlow显著优于现有的最先进方法。此外,HDFlow还在两个长时程基准测试中展示了其通用性,这些基准测试包含各种运动和操作任务。具体性能数据和提升幅度在论文中有详细展示。

🎯 应用场景

HDFlow具有广泛的应用前景,可应用于机器人操作、自动驾驶、游戏AI等领域。例如,在机器人操作中,HDFlow可以用于规划复杂的装配任务;在自动驾驶中,HDFlow可以用于规划长距离的行驶路线。该研究的实际价值在于提高了长时程任务规划的效率和鲁棒性,为实现更智能的机器人和自动化系统奠定了基础。未来,HDFlow可以进一步扩展到多智能体协作、动态环境等更复杂的场景。

📄 摘要(原文)

Recent advances in generative models have shown promise in generating behavior plans for long-horizon, sparse reward tasks. While these approaches have achieved promising results, they often lack a principled framework for hierarchical decomposition and struggle with the computational demands of real-time execution, due to their iterative denoising process. In this work, we introduce Hierarchical Diffusion-Flow (HDFlow), a novel hierarchical planning framework that optimally leverages the strengths of diffusion and rectified flow models to overcome the limitations of single-paradigm generative planners. HDFlow employs a high-level diffusion planner to generate sequences of strategic subgoals in a learned latent space, capitalizing on diffusion's powerful exploratory capabilities. These subgoals then guide a low-level rectified flow planner that generates smooth and dense trajectories, exploiting the speed and efficiency of ordinary differential equation (ODE)-based trajectory generation. We evaluate HDFlow on four challenging furniture assembly tasks in both simulation and real-world, where it significantly outperforms state-of-the-art methods. Furthermore, we also showcase our method's generalizability on two long-horizon benchmarks comprising diverse locomotion and manipulation tasks. Project website: https://hdflow-page.github.io/