Beyond Imitation: Constraint-Aware Trajectory Generation with Flow Matching For End-to-End Autonomous Driving
作者: Lin Liu, Guanyi Yu, Ziying Song, Junqiao Li, Caiyan Jia, Feiyang Jia, Peiliang Wu, Yandan Luo
分类: cs.CV
发布日期: 2025-10-30
💡 一句话要点
提出CATG:基于约束流匹配的端到端自动驾驶轨迹生成框架,解决模仿学习模式崩溃问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 自动驾驶 轨迹规划 流匹配 约束优化 模仿学习
📋 核心要点
- 模仿学习在自动驾驶轨迹规划中面临模式崩溃问题,难以生成多样化轨迹,泛化能力受限。
- CATG通过约束流匹配显式建模轨迹生成过程,缓解模式崩溃,并允许灵活的条件信号指导。
- CATG将安全和运动学约束直接融入流匹配过程,并参数化驾驶风格,在NavSim v2挑战赛中取得优异成绩。
📝 摘要(中文)
本文提出了一种名为CATG的新型规划框架,该框架利用约束流匹配来解决端到端自动驾驶中轨迹规划问题。现有的模仿学习方法容易出现模式崩溃,无法生成多样化的轨迹假设。同时,现有的生成方法难以将关键的安全和物理约束直接融入生成过程,需要额外的优化阶段来改进输出。CATG显式地对流匹配过程进行建模,从而减轻模式崩溃,并允许来自各种条件信号的灵活指导。主要贡献在于将显式约束直接施加到流匹配过程中,确保生成的轨迹符合重要的安全和运动学规则。此外,CATG将驾驶激进程度参数化为生成过程中的控制信号,从而能够精确地控制轨迹风格。在NavSim v2挑战赛中,CATG以51.31的EPDMS得分获得第二名,并荣获创新奖。
🔬 方法详解
问题定义:端到端自动驾驶中的轨迹规划任务,现有模仿学习方法容易陷入模式崩溃,导致生成轨迹的多样性不足,难以应对复杂场景。同时,现有的生成式方法难以直接将安全约束和车辆运动学约束融入轨迹生成过程,通常需要后处理优化,增加了计算负担和复杂性。
核心思路:利用流匹配(Flow Matching)的生成能力,显式地建模轨迹生成过程,从而避免模式崩溃。通过在流匹配过程中直接施加约束,保证生成的轨迹满足安全和运动学要求,无需额外的优化步骤。此外,将驾驶激进程度参数化,作为控制信号,实现对轨迹风格的精确控制。
技术框架:CATG框架主要包含一个条件流匹配模型。该模型以当前车辆状态、环境信息(例如,道路结构、交通参与者)以及驾驶风格(激进程度)作为输入,生成满足约束条件的轨迹。具体流程为:首先,将输入信息编码为潜在空间向量;然后,通过流匹配模型将潜在空间向量映射到轨迹空间,生成初始轨迹;最后,在流匹配过程中,通过约束条件对轨迹进行调整,确保其满足安全和运动学要求。
关键创新:最重要的创新点在于将约束条件直接融入到流匹配的生成过程中。传统方法通常在生成轨迹后进行约束优化,而CATG通过修改流匹配的目标函数,使得生成的轨迹天然满足约束条件,从而提高了效率和轨迹质量。此外,参数化驾驶风格也是一个创新点,允许用户根据需求调整轨迹的激进程度。
关键设计:CATG使用了一种特殊的流匹配模型,该模型的目标函数包含两部分:一部分是标准的流匹配损失,用于保证轨迹的生成质量;另一部分是约束损失,用于惩罚违反约束条件的轨迹。约束损失的具体形式取决于具体的约束类型,例如,对于碰撞避免约束,可以使用距离损失,对于速度限制约束,可以使用速度差损失。此外,CATG还设计了一个驾驶风格编码器,将驾驶激进程度映射到一个潜在空间向量,作为流匹配模型的输入。
🖼️ 关键图片
📊 实验亮点
CATG在NavSim v2挑战赛中取得了显著成果,以51.31的EPDMS得分获得第二名,并荣获创新奖。这一结果表明,CATG在轨迹生成方面具有很强的竞争力,能够生成高质量、满足约束条件的轨迹。与传统的模仿学习方法相比,CATG能够更好地应对复杂场景,提高自动驾驶系统的鲁棒性。
🎯 应用场景
CATG框架可应用于各种自动驾驶场景,例如城市道路、高速公路和停车场。通过显式地考虑安全约束和运动学约束,CATG可以生成更安全、更可靠的轨迹,提高自动驾驶系统的整体性能。此外,CATG还可以用于辅助驾驶系统,帮助驾驶员更好地控制车辆,提高驾驶安全性。
📄 摘要(原文)
Planning is a critical component of end-to-end autonomous driving. However, prevailing imitation learning methods often suffer from mode collapse, failing to produce diverse trajectory hypotheses. Meanwhile, existing generative approaches struggle to incorporate crucial safety and physical constraints directly into the generative process, necessitating an additional optimization stage to refine their outputs. To address these limitations, we propose CATG, a novel planning framework that leverages Constrained Flow Matching. Concretely, CATG explicitly models the flow matching process, which inherently mitigates mode collapse and allows for flexible guidance from various conditioning signals. Our primary contribution is the novel imposition of explicit constraints directly within the flow matching process, ensuring that the generated trajectories adhere to vital safety and kinematic rules. Secondly, CATG parameterizes driving aggressiveness as a control signal during generation, enabling precise manipulation of trajectory style. Notably, on the NavSim v2 challenge, CATG achieved 2nd place with an EPDMS score of 51.31 and was honored with the Innovation Award.