FlowDrive: moderated flow matching with data balancing for trajectory planning

📄 arXiv: 2509.21961v1 📥 PDF

作者: Lingguang Wang, Ömer Şahin Taş, Marlon Steiner, Christoph Stiller

分类: cs.RO, cs.AI, cs.LG

发布日期: 2025-09-26


💡 一句话要点

FlowDrive:结合数据平衡的适度流匹配轨迹规划,提升罕见场景性能

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 轨迹规划 流匹配 数据平衡 长尾分布 自动驾驶 条件修正流 环内指导

📋 核心要点

  1. 现有学习型轨迹规划器易受驾驶数据长尾分布影响,罕见场景性能下降。
  2. FlowDrive通过轨迹模式重加权平衡数据,并使用条件修正流直接映射噪声到轨迹。
  3. 引入适度环内指导,增加轨迹多样性并保持场景一致性,显著提升规划性能。

📝 摘要(中文)

基于学习的规划器对驾驶数据的长尾分布非常敏感。常见驾驶行为在数据集中占据主导地位,而危险或罕见场景则非常稀疏。这种不平衡会使模型偏向于常见情况,并降低在关键场景中的性能。为了解决这个问题,我们比较了平衡训练数据抽样策略,发现通过轨迹模式进行重加权是一种有效的方法。然后,我们提出了FlowDrive,一种流匹配轨迹规划器,它学习条件修正流,以通过少量流匹配步骤将噪声直接映射到轨迹分布。我们进一步引入了适度的、环内指导,在流步骤之间注入小的扰动,以系统地增加轨迹多样性,同时保持场景一致性。在nuPlan和以交互为中心的interPlan基准测试中,FlowDrive在基于学习的规划器中取得了最先进的结果,并接近具有基于规则的改进的方法。在添加适度的指导和轻量级后处理(FlowDrive*)后,它在几乎所有基准测试分割中都实现了总体最先进的性能。

🔬 方法详解

问题定义:现有的基于学习的轨迹规划方法在处理驾驶数据时,由于数据集中常见驾驶行为占据主导地位,而危险或罕见场景数据稀疏,导致模型训练偏向常见情况,在关键或罕见场景下的性能显著下降。这种长尾分布问题是学习型规划器面临的主要挑战。

核心思路:FlowDrive的核心思路是通过数据平衡策略解决长尾分布问题,并利用流匹配模型直接学习从噪声到轨迹分布的映射。此外,通过引入适度的环内指导,增加轨迹的多样性,从而提升模型在各种场景下的泛化能力。

技术框架:FlowDrive包含以下主要模块:1) 数据平衡模块:通过轨迹模式重加权,平衡训练数据分布。2) 流匹配轨迹规划器:学习条件修正流,将噪声映射到轨迹分布。3) 适度环内指导模块:在流匹配步骤之间注入小的扰动,增加轨迹多样性。整体流程是从平衡后的数据中学习流模型,然后在规划过程中,通过适度指导生成多样且场景一致的轨迹。

关键创新:FlowDrive的关键创新在于:1) 提出了一种基于轨迹模式重加权的数据平衡方法,有效缓解了长尾分布问题。2) 引入了适度的环内指导,在流匹配过程中增加轨迹多样性,提升了模型的泛化能力。3) 将流匹配模型应用于轨迹规划,实现了从噪声到轨迹分布的直接学习,减少了中间步骤。

关键设计:数据平衡模块使用轨迹模式(例如,变道、转弯等)对数据进行分类,并根据各类别的样本数量进行重加权,使得罕见场景的样本在训练过程中具有更高的权重。流匹配模型采用条件修正流,损失函数为标准的流匹配损失。适度环内指导通过在每个流匹配步骤中添加小的随机扰动来实现,扰动的大小和方向由一个可学习的网络控制,以确保轨迹的场景一致性。

📊 实验亮点

FlowDrive在nuPlan和interPlan基准测试中取得了显著成果。在nuPlan上,FlowDrive在基于学习的规划器中达到了最先进的性能,并接近于具有基于规则的改进的方法。添加适度指导和轻量级后处理后(FlowDrive*),在几乎所有基准测试分割中都实现了最先进的性能,表明其在复杂驾驶场景下的优越性。

🎯 应用场景

FlowDrive可应用于自动驾驶、机器人导航等领域,尤其是在需要处理复杂和不确定环境的场景中。通过提升在罕见和危险场景下的轨迹规划能力,可以显著提高自动驾驶系统的安全性和可靠性,降低事故风险,加速自动驾驶技术的商业化落地。

📄 摘要(原文)

Learning-based planners are sensitive to the long-tailed distribution of driving data. Common maneuvers dominate datasets, while dangerous or rare scenarios are sparse. This imbalance can bias models toward the frequent cases and degrade performance on critical scenarios. To tackle this problem, we compare balancing strategies for sampling training data and find reweighting by trajectory pattern an effective approach. We then present FlowDrive, a flow-matching trajectory planner that learns a conditional rectified flow to map noise directly to trajectory distributions with few flow-matching steps. We further introduce moderated, in-the-loop guidance that injects small perturbation between flow steps to systematically increase trajectory diversity while remaining scene-consistent. On nuPlan and the interaction-focused interPlan benchmarks, FlowDrive achieves state-of-the-art results among learning-based planners and approaches methods with rule-based refinements. After adding moderated guidance and light post-processing (FlowDrive*), it achieves overall state-of-the-art performance across nearly all benchmark splits.