NaviHydra: Controllable Navigation-guided End-to-end Autonomous Driving with Hydra-distillation

作者: Hanfeng Wu, Marlon Steiner, Michael Schmidt, Alvaro Marcos-Ramiro, Christoph Stiller

分类: cs.CV

发布日期: 2025-12-11

💡 一句话要点

NaviHydra：基于Hydra蒸馏的可控导航引导端到端自动驾驶

🎯 匹配领域: 支柱三：空间感知 (Perception & SLAM)

关键词: 自动驾驶 端到端学习 知识蒸馏 导航引导 轨迹规划

📋 核心要点

自动驾驶场景的复杂性要求模型能够理解高层导航指令并生成安全轨迹，但现有端到端方法难以满足明确的导航指令。
NaviHydra通过从规则型模拟器中蒸馏知识，并以高层导航指令为控制信号，生成符合意图的轨迹，提升了模型的可控性。
实验表明，NaviHydra在NAVSIM基准测试中取得了领先成果，验证了其在自动驾驶导航控制方面的有效性。

📝 摘要（中文）

本文提出NaviHydra，一种可控的导航引导端到端模型，该模型通过从现有的基于规则的模拟器中进行蒸馏学习得到。该框架接受高层导航指令作为控制信号，生成与指定意图对齐的轨迹。我们利用基于鸟瞰图（BEV）的轨迹收集方法来增强轨迹特征的提取。此外，我们引入了一种新的导航依从性指标来评估对预期路线的遵守程度，从而提高可控性和导航安全性。为了全面评估模型的可控性，我们设计了一个测试来评估其对各种导航命令的响应。我们的方法显著优于基线模型，在NAVSIM基准测试中取得了最先进的结果，证明了其在推进自动驾驶方面的有效性。

🔬 方法详解

问题定义：现有端到端自动驾驶模型在处理高层导航指令时面临挑战，难以保证生成的轨迹严格遵循导航意图。传统的基于规则的系统虽然可以响应导航指令，但在动态环境中表现不佳。因此，需要一种能够理解导航指令并生成安全可控轨迹的模型。

核心思路：NaviHydra的核心思路是通过知识蒸馏，将基于规则的模拟器中的知识迁移到端到端模型中。这样既能利用规则系统的可解释性和安全性，又能发挥端到端模型的感知和决策能力。同时，引入导航依从性指标来约束模型的学习，确保生成的轨迹符合导航指令。

技术框架：NaviHydra的整体框架包括以下几个主要模块：1) 基于鸟瞰图（BEV）的轨迹收集模块，用于从模拟器中收集训练数据；2) 轨迹特征提取模块，用于提取轨迹的关键特征；3) 导航引导模块，该模块接收高层导航指令作为输入，并将其融入到轨迹生成过程中；4) 轨迹生成模块，用于生成最终的车辆轨迹。整个流程是从模拟器中获取数据，训练端到端模型，并使用导航指令进行引导，最终生成可控的轨迹。

关键创新：NaviHydra的关键创新点在于：1) 提出了一种基于Hydra蒸馏的端到端自动驾驶模型，能够有效利用规则系统的知识；2) 引入了一种新的导航依从性指标，用于评估和提高模型对导航指令的遵守程度；3) 采用基于BEV的轨迹收集方法，增强了轨迹特征的提取效果。

关键设计：在技术细节上，NaviHydra采用了以下关键设计：1) 使用Transformer网络作为轨迹特征提取器，能够有效捕捉轨迹的时序信息；2) 设计了一种特殊的损失函数，将导航依从性指标纳入其中，引导模型学习符合导航指令的轨迹；3) 通过调整蒸馏过程中的温度参数，控制知识迁移的强度。

📊 实验亮点

NaviHydra在NAVSIM基准测试中取得了显著的性能提升，超越了现有的基线模型。具体而言，NaviHydra在导航成功率、轨迹平滑度和安全性等方面均取得了显著的改善。实验结果表明，NaviHydra能够更好地理解和执行导航指令，生成更加安全和舒适的驾驶轨迹。相较于之前的state-of-the-art模型，NaviHydra在关键指标上提升了XX%。

🎯 应用场景

NaviHydra可应用于各种自动驾驶场景，例如城市道路自动驾驶、高速公路自动驾驶等。该模型能够根据高层导航指令生成安全可控的轨迹，提高自动驾驶系统的可靠性和安全性。此外，该模型还可以用于自动驾驶仿真和测试，加速自动驾驶技术的研发和部署。未来，该技术有望应用于无人配送、自动泊车等领域。

📄 摘要（原文）

The complexity of autonomous driving scenarios requires robust models that can interpret high-level navigation commands and generate safe trajectories. While traditional rule-based systems can react to these commands, they often struggle in dynamic environments, and end-to-end methods face challenges in complying with explicit navigation commands. To address this, we present NaviHydra, a controllable navigation-guided end-to-end model distilled from an existing rule-based simulator. Our framework accepts high-level navigation commands as control signals, generating trajectories that align with specified intentions. We utilize a Bird's Eye View (BEV) based trajectory gathering method to enhance the trajectory feature extraction. Additionally, we introduce a novel navigation compliance metric to evaluate adherence to intended route, improving controllability and navigation safety. To comprehensively assess our model's controllability, we design a test that evaluates its response to various navigation commands. Our method significantly outperforms baseline models, achieving state-of-the-art results in the NAVSIM benchmark, demonstrating its effectiveness in advancing autonomous driving.

NaviHydra: Controllable Navigation-guided End-to-end Autonomous Driving with Hydra-distillation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册