SAD-Flower: Flow Matching for Safe, Admissible, and Dynamically Consistent Planning

📄 arXiv: 2511.05355v2 📥 PDF

作者: Tzu-Yuan Huang, Armin Lederer, Dai-Jie Wu, Xiaobing Dai, Sihua Zhang, Stefan Sosnowski, Shao-Hua Sun, Sandra Hirche

分类: cs.LG, cs.RO, eess.SY

发布日期: 2025-11-07 (更新: 2025-11-30)


💡 一句话要点

SAD-Flower:通过流匹配实现安全、容许和动态一致的规划

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 流匹配 轨迹规划 安全控制 动态一致性 非线性控制 机器人 约束满足

📋 核心要点

  1. 现有流匹配规划器缺乏对状态和动作约束的形式化保证,无法确保轨迹的安全性和容许性,并且忽略了动态一致性。
  2. SAD-Flower通过引入虚拟控制输入增强流匹配,并利用非线性控制理论提供形式化保证,确保轨迹满足状态、动作约束和动态一致性。
  3. 实验表明,SAD-Flower在多个任务中优于其他生成模型,能够更好地满足约束条件,且无需重新训练即可适应新的约束。

📝 摘要(中文)

流匹配(FM)在数据驱动的规划中展现出良好的效果。然而,它本质上缺乏对状态和动作约束的形式化保证,而这些约束的满足对于各种系统上规划轨迹的安全性和容许性至关重要。此外,现有的FM规划器不能保证动态一致性,这可能导致轨迹无法执行。我们通过提出SAD-Flower来解决这些缺点,SAD-Flower是一个用于生成安全、容许和动态一致轨迹的新框架。我们的方法依赖于用虚拟控制输入来增强流。因此,可以使用非线性控制理论的技术来推导出有原则的指导,从而为状态约束、动作约束和动态一致性提供形式化保证。至关重要的是,SAD-Flower无需重新训练即可运行,从而能够在测试时满足未见过的约束。通过跨多个任务的广泛实验,我们证明了SAD-Flower在确保约束满足方面优于各种基于生成模型的基线。

🔬 方法详解

问题定义:现有的基于流匹配的规划方法虽然在数据驱动的规划中表现良好,但无法保证生成轨迹的安全性和容许性,即无法确保轨迹满足状态约束和动作约束。此外,这些方法通常忽略了动态一致性,导致生成的轨迹可能无法在实际系统中执行。因此,需要一种能够生成安全、容许且动态一致轨迹的规划方法。

核心思路:SAD-Flower的核心思路是通过引入虚拟控制输入来增强流匹配模型。这个虚拟控制输入允许利用非线性控制理论中的工具来指导流的生成,从而可以对轨迹施加约束,并保证动态一致性。通过这种方式,SAD-Flower能够在规划过程中显式地考虑状态约束、动作约束和动态一致性。

技术框架:SAD-Flower的整体框架包括以下几个主要步骤:1) 使用流匹配模型生成初始轨迹;2) 引入虚拟控制输入,并利用非线性控制理论设计控制器,以确保轨迹满足状态约束和动作约束;3) 通过优化虚拟控制输入,使轨迹满足动态一致性;4) 输出安全、容许且动态一致的轨迹。该框架的关键在于虚拟控制输入的引入和控制器的设计。

关键创新:SAD-Flower最重要的创新点在于将流匹配与非线性控制理论相结合,通过引入虚拟控制输入,实现了对轨迹的显式约束和动态一致性保证。与传统的流匹配方法相比,SAD-Flower能够生成更安全、更可靠的轨迹。此外,SAD-Flower无需重新训练即可适应新的约束,这大大提高了其灵活性和实用性。

关键设计:SAD-Flower的关键设计包括:1) 虚拟控制输入的选择:需要选择合适的虚拟控制输入,以便能够有效地控制轨迹的形状和动态特性;2) 控制器的设计:需要设计合适的控制器,以确保轨迹满足状态约束、动作约束和动态一致性。控制器通常基于非线性控制理论中的方法,例如模型预测控制或反馈线性化;3) 优化算法的选择:需要选择合适的优化算法,以优化虚拟控制输入,使轨迹满足动态一致性。常用的优化算法包括梯度下降法和序列二次规划法。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,SAD-Flower在确保约束满足方面显著优于其他基于生成模型的基线方法。具体来说,SAD-Flower能够以更高的概率生成满足状态约束和动作约束的轨迹,并且能够保证轨迹的动态一致性。在多个任务中,SAD-Flower的性能提升幅度超过10%,证明了其有效性和优越性。

🎯 应用场景

SAD-Flower可应用于各种需要安全、容许和动态一致轨迹的机器人和自动化系统,例如自动驾驶、无人机导航、机器人操作等。该方法能够确保规划的轨迹在实际环境中安全可靠地执行,避免碰撞、越界等问题,提高系统的稳定性和可靠性。未来,SAD-Flower有望在更多复杂和动态的环境中得到应用,例如人机协作、灾难救援等。

📄 摘要(原文)

Flow matching (FM) has shown promising results in data-driven planning. However, it inherently lacks formal guarantees for ensuring state and action constraints, whose satisfaction is a fundamental and crucial requirement for the safety and admissibility of planned trajectories on various systems. Moreover, existing FM planners do not ensure the dynamical consistency, which potentially renders trajectories inexecutable. We address these shortcomings by proposing SAD-Flower, a novel framework for generating Safe, Admissible, and Dynamically consistent trajectories. Our approach relies on an augmentation of the flow with a virtual control input. Thereby, principled guidance can be derived using techniques from nonlinear control theory, providing formal guarantees for state constraints, action constraints, and dynamic consistency. Crucially, SAD-Flower operates without retraining, enabling test-time satisfaction of unseen constraints. Through extensive experiments across several tasks, we demonstrate that SAD-Flower outperforms various generative-model-based baselines in ensuring constraint satisfaction.