Beyond Imitation: Constraint-Aware Trajectory Generation with Flow Matching For End-to-End Autonomous Driving

📄 arXiv: 2510.26292v1 📥 PDF

作者: Lin Liu, Guanyi Yu, Ziying Song, Junqiao Li, Caiyan Jia, Feiyang Jia, Peiliang Wu, Yandan Luo

分类: cs.CV

发布日期: 2025-10-30


💡 一句话要点

提出CATG,利用约束流匹配进行端到端自动驾驶轨迹生成,解决模仿学习模式崩塌问题。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 自动驾驶 轨迹规划 流匹配 约束优化 模仿学习 生成模型 运动规划

📋 核心要点

  1. 模仿学习在自动驾驶规划中易出现模式崩塌,导致轨迹多样性不足,生成方法难以直接融入安全约束。
  2. CATG利用约束流匹配,显式建模流匹配过程,直接在生成过程中施加安全和运动学约束。
  3. CATG在NavSim v2挑战赛中获得第二名,EPDMS得分为51.31,并荣获创新奖,验证了有效性。

📝 摘要(中文)

本文提出了一种名为CATG的新型规划框架,该框架利用约束流匹配来解决端到端自动驾驶中的规划问题。现有的模仿学习方法容易出现模式崩塌,无法生成多样化的轨迹假设。同时,现有的生成方法难以将关键的安全和物理约束直接融入生成过程,需要额外的优化阶段来改进输出。CATG显式地建模了流匹配过程,从而减轻了模式崩塌,并允许来自各种条件信号的灵活指导。主要贡献在于将显式约束直接施加于流匹配过程中,确保生成的轨迹符合重要的安全和运动学规则。此外,CATG将驾驶激进程度参数化为生成过程中的控制信号,从而能够精确地控制轨迹风格。在NavSim v2挑战赛中,CATG获得了第二名,EPDMS得分为51.31,并荣获创新奖。

🔬 方法详解

问题定义:端到端自动驾驶中的轨迹规划任务,目标是生成安全、可行且符合驾驶风格的轨迹。现有模仿学习方法容易陷入模式崩塌,导致生成轨迹的多样性不足,难以应对复杂场景。而现有的生成式方法通常难以直接将安全和物理约束融入到生成过程中,需要额外的优化步骤来保证轨迹的安全性,增加了计算负担和复杂性。

核心思路:本文的核心思路是利用约束流匹配(Constrained Flow Matching)来生成轨迹。流匹配方法能够有效缓解模式崩塌问题,并且可以通过条件信号来引导轨迹的生成。更重要的是,本文创新性地将约束直接嵌入到流匹配过程中,使得生成的轨迹在满足多样性的同时,能够天然地满足安全和运动学约束,避免了后处理优化步骤。

技术框架:CATG框架主要包含以下几个部分:首先,使用神经网络学习一个条件向量场,该向量场定义了从噪声分布到目标轨迹的连续变换。其次,在训练过程中,通过引入约束损失函数,强制向量场生成的轨迹满足安全和运动学约束。最后,在推理阶段,通过采样噪声并沿着向量场进行积分,生成满足约束的轨迹。驾驶激进程度被参数化为一个控制信号,用于调整生成的轨迹风格。

关键创新:最重要的创新点在于将显式约束直接嵌入到流匹配过程中。传统的生成式方法通常先生成轨迹,然后再通过优化来满足约束,而CATG则在生成过程中就保证了轨迹的安全性。这种方法不仅提高了效率,也使得生成的轨迹更加自然和可行。

关键设计:CATG的关键设计包括:1) 使用神经网络来参数化条件向量场,该网络以环境信息和驾驶风格作为输入;2) 设计了专门的约束损失函数,用于强制生成的轨迹满足安全距离、速度限制和加速度限制等约束;3) 使用了数值积分方法(如欧拉方法或龙格-库塔方法)来沿着向量场进行积分,生成最终的轨迹。

📊 实验亮点

CATG在NavSim v2挑战赛中取得了显著成果,获得了第二名,EPDMS得分为51.31,并荣获创新奖。这一结果表明,CATG在复杂驾驶场景下具有强大的轨迹生成能力和安全性。相较于传统的模仿学习方法,CATG能够生成更加多样化的轨迹,并且能够更好地满足安全约束。

🎯 应用场景

CATG可应用于各种自动驾驶场景,例如城市道路、高速公路和越野环境。该方法能够生成安全、多样且符合驾驶风格的轨迹,提高自动驾驶系统的可靠性和适应性。此外,CATG还可以应用于机器人导航、游戏AI等领域,为这些领域提供更智能、更安全的运动规划能力。

📄 摘要(原文)

Planning is a critical component of end-to-end autonomous driving. However, prevailing imitation learning methods often suffer from mode collapse, failing to produce diverse trajectory hypotheses. Meanwhile, existing generative approaches struggle to incorporate crucial safety and physical constraints directly into the generative process, necessitating an additional optimization stage to refine their outputs. To address these limitations, we propose CATG, a novel planning framework that leverages Constrained Flow Matching. Concretely, CATG explicitly models the flow matching process, which inherently mitigates mode collapse and allows for flexible guidance from various conditioning signals. Our primary contribution is the novel imposition of explicit constraints directly within the flow matching process, ensuring that the generated trajectories adhere to vital safety and kinematic rules. Secondly, CATG parameterizes driving aggressiveness as a control signal during generation, enabling precise manipulation of trajectory style. Notably, on the NavSim v2 challenge, CATG achieved 2nd place with an EPDMS score of 51.31 and was honored with the Innovation Award.