FlowDrive: moderated flow matching with data balancing for trajectory planning
作者: Lingguang Wang, Ömer Şahin Taş, Marlon Steiner, Christoph Stiller
分类: cs.RO, cs.AI, cs.LG
发布日期: 2025-09-26
💡 一句话要点
FlowDrive:结合数据平衡的适度流匹配轨迹规划,提升罕见场景性能。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 轨迹规划 流匹配 数据平衡 长尾分布 自动驾驶 适度引导 条件修正流
📋 核心要点
- 现有学习型轨迹规划器易受驾驶数据长尾分布影响,导致罕见场景性能下降。
- FlowDrive通过轨迹模式重加权平衡数据,并利用条件修正流直接从噪声生成轨迹。
- FlowDrive引入适度环内引导,增加轨迹多样性,在nuPlan和interPlan上取得SOTA结果。
📝 摘要(中文)
基于学习的规划器对驾驶数据的长尾分布非常敏感。常见驾驶行为在数据集中占据主导地位,而危险或罕见场景则非常稀疏。这种不平衡会使模型偏向于常见情况,并降低在关键场景中的性能。为了解决这个问题,我们比较了平衡训练数据抽样策略,发现通过轨迹模式重新加权是一种有效的方法。然后,我们提出了FlowDrive,一种流匹配轨迹规划器,它学习条件修正流,以通过少量流匹配步骤将噪声直接映射到轨迹分布。我们进一步引入了适度的、环内引导,在流步骤之间注入小的扰动,以系统地增加轨迹多样性,同时保持场景一致性。在nuPlan和以交互为中心的interPlan基准测试中,FlowDrive在基于学习的规划器中取得了最先进的结果,并接近具有基于规则的改进的方法。在添加适度的引导和轻量级后处理(FlowDrive*)后,它在几乎所有基准测试分割中实现了总体最先进的性能。
🔬 方法详解
问题定义:轨迹规划任务面临驾驶数据长尾分布的挑战,即常见驾驶行为数据量大,而危险或罕见场景数据量小。这导致学习型规划器容易过拟合常见场景,在罕见场景下泛化能力差,影响安全性。现有方法难以有效平衡数据分布,或无法充分探索轨迹空间。
核心思路:FlowDrive的核心思路是利用流匹配模型直接学习从噪声到轨迹分布的映射,并结合数据平衡策略和适度引导来解决长尾分布问题。通过流匹配,模型可以生成更多样化的轨迹,而数据平衡和适度引导则有助于模型关注罕见场景,提高泛化能力。
技术框架:FlowDrive包含以下主要模块:1) 数据平衡模块:通过轨迹模式对训练数据进行重加权,增加罕见场景的权重。2) 流匹配模块:学习一个条件修正流,将噪声映射到轨迹分布。3) 适度引导模块:在流匹配的每一步之间注入小的扰动,增加轨迹多样性。整体流程是:首先对训练数据进行平衡,然后训练流匹配模型,最后在推理时使用流匹配模型生成轨迹,并使用适度引导增加轨迹多样性。
关键创新:FlowDrive的关键创新点在于:1) 提出了一种基于轨迹模式的数据重加权方法,有效平衡了长尾分布的驾驶数据。2) 引入了适度引导,在流匹配过程中注入小的扰动,系统地增加了轨迹多样性,同时保持了场景一致性。3) 将流匹配模型应用于轨迹规划任务,实现了端到端的轨迹生成。
关键设计:数据平衡模块使用轨迹模式(例如,变道、转弯等)对数据进行分类,并根据每个模式的频率进行重加权。流匹配模块使用神经网络学习条件修正流,损失函数为标准的流匹配损失。适度引导模块在每个流匹配步骤中,根据当前状态和场景信息,注入一个小的扰动,扰动的大小由一个可学习的参数控制。具体网络结构和参数设置在论文中有详细描述。
🖼️ 关键图片
📊 实验亮点
FlowDrive在nuPlan和interPlan基准测试中取得了显著的性能提升。在nuPlan上,FlowDrive在基于学习的规划器中取得了SOTA结果,并接近具有基于规则的改进的方法。在添加适度引导和轻量级后处理(FlowDrive*)后,它在几乎所有基准测试分割中实现了总体SOTA性能。尤其是在交互场景中,FlowDrive的性能提升更为明显,表明其在复杂交通环境下的规划能力更强。
🎯 应用场景
FlowDrive可应用于自动驾驶汽车的轨迹规划系统,尤其是在复杂和动态的交通环境中。通过提高在罕见和危险场景下的规划能力,FlowDrive可以显著提升自动驾驶系统的安全性,并减少事故发生的概率。此外,该方法还可以应用于机器人导航、游戏AI等领域。
📄 摘要(原文)
Learning-based planners are sensitive to the long-tailed distribution of driving data. Common maneuvers dominate datasets, while dangerous or rare scenarios are sparse. This imbalance can bias models toward the frequent cases and degrade performance on critical scenarios. To tackle this problem, we compare balancing strategies for sampling training data and find reweighting by trajectory pattern an effective approach. We then present FlowDrive, a flow-matching trajectory planner that learns a conditional rectified flow to map noise directly to trajectory distributions with few flow-matching steps. We further introduce moderated, in-the-loop guidance that injects small perturbation between flow steps to systematically increase trajectory diversity while remaining scene-consistent. On nuPlan and the interaction-focused interPlan benchmarks, FlowDrive achieves state-of-the-art results among learning-based planners and approaches methods with rule-based refinements. After adding moderated guidance and light post-processing (FlowDrive*), it achieves overall state-of-the-art performance across nearly all benchmark splits.