Lost in Fog: Sensor Perturbations Expose Reasoning Fragility in Driving VLAs

作者: Abhinaw Priyadershi, Jelena Frtunikj

分类: cs.RO, cs.AI

发布日期: 2026-05-20

💡 一句话要点

研究传感器扰动对自动驾驶VLA模型推理一致性的影响，提出基于因果链一致性的安全监控方法。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 自动驾驶 视觉语言动作模型 鲁棒性 传感器扰动 因果链解释 推理一致性 安全监控

📋 核心要点

自动驾驶规划器依赖于可解释性，但现有方法在真实传感器退化情况下，解释的可靠性面临挑战。
论文提出通过受控扰动研究VLA模型的鲁棒性，核心思想是利用因果链（CoC）解释的一致性作为轨迹可靠性的指标。
实验结果表明，CoC一致性与轨迹准确性高度相关，CoC变化时轨迹偏差显著增加，且启用CoC生成能提升轨迹准确性。

📝 摘要（中文）

本文针对自动驾驶中视觉-语言-动作（VLA）模型的鲁棒性问题，提出了一项受控扰动研究，评估了Alpamayo R1（100亿参数）在1996个场景下，受到八种传感器扰动（四种强度的高斯噪声、两种极端光照和两种雾霾等级；约18000次推理试验）时的性能。研究发现，推理一致性是轨迹可靠性的高保真指标：当因果链（CoC）解释在扰动后发生变化时，轨迹偏差会显著增加5.3倍（21.8米 vs 4.1米），攻击类型之间的相关系数r=0.99，样本间的相关系数r_pb=0.53（Cohen's d=1.12）。受控消融实验表明，启用CoC生成与提高轨迹准确性相关（在匹配的推理设置下，平均提高11.8%；p < 0.0001）。在测试的噪声范围内（σ∈{10, 30, 50, 70}），性能退化近似线性（R^2=0.957），而标准输入预处理防御仅提供边际缓解。这些结果表明，CoC一致性是规划安全性的定量代理，并推动了基于推理的运行时监控，以实现更安全的VLA部署。

🔬 方法详解

问题定义：自动驾驶系统依赖视觉传感器进行环境感知和决策，但真实世界中传感器容易受到各种扰动（如噪声、光照变化、雾霾等）的影响。现有VLA模型在传感器数据质量下降时，其推理过程和决策的可靠性会受到质疑，缺乏有效的评估和监控方法。因此，如何评估和提高VLA模型在恶劣环境下的鲁棒性，是当前自动驾驶研究面临的重要问题。

核心思路：论文的核心思路是利用因果链（Chain-of-Causation, CoC）解释的一致性来评估VLA模型的鲁棒性。CoC解释旨在提供模型决策过程的可解释性，如果模型在受到扰动后，CoC解释发生显著变化，则表明模型的推理过程不稳定，可能导致错误的决策。通过监控CoC解释的一致性，可以作为VLA模型安全性的一个定量代理。

技术框架：论文采用Alpamayo R1（10B参数）作为VLA模型，并在CARLA模拟器中构建了包含1996个场景的测试集。实验流程如下：1) 对输入图像施加不同类型的传感器扰动（高斯噪声、光照变化、雾霾）；2) 使用VLA模型生成轨迹和CoC解释；3) 比较扰动前后CoC解释的变化；4) 分析CoC解释变化与轨迹偏差之间的关系。

关键创新：论文的关键创新在于将CoC解释的一致性作为VLA模型鲁棒性的评估指标。与传统的直接评估轨迹准确性的方法相比，CoC一致性能够更深入地反映模型推理过程的稳定性。此外，论文还通过受控扰动实验，系统地研究了不同类型的传感器扰动对VLA模型性能的影响，为VLA模型的鲁棒性研究提供了新的视角。

关键设计：论文的关键设计包括：1) 采用多种类型的传感器扰动，以模拟真实世界中可能遇到的各种恶劣环境；2) 使用Alpamayo R1模型，该模型具有生成CoC解释的能力；3) 通过消融实验，验证CoC生成对轨迹准确性的影响；4) 使用相关系数和Cohen's d等统计指标，量化CoC一致性与轨迹偏差之间的关系。

🖼️ 关键图片

📊 实验亮点

实验结果表明，当CoC解释在扰动后发生变化时，轨迹偏差会显著增加5.3倍（21.8米 vs 4.1米），攻击类型之间的相关系数r=0.99，样本间的相关系数r_pb=0.53（Cohen's d=1.12）。消融实验表明，启用CoC生成与提高轨迹准确性相关（平均提高11.8%；p < 0.0001）。在测试的噪声范围内（σ∈{10, 30, 50, 70}），性能退化近似线性（R^2=0.957）。

🎯 应用场景

该研究成果可应用于自动驾驶系统的安全监控和故障诊断。通过实时监测VLA模型的CoC解释一致性，可以及时发现潜在的风险，并采取相应的措施，例如切换到更保守的驾驶策略或请求人工干预。此外，该研究还可以指导VLA模型的训练和优化，提高模型在恶劣环境下的鲁棒性，从而提升自动驾驶系统的安全性。

📄 摘要（原文）

Interpretable autonomous driving planners depend not only on generating explanations, but also on those explanations remaining reliable under real-world sensor degradation. In this paper we present a controlled perturbation study of Vision-Language-Action (VLA) robustness in autonomous driving, evaluating Alpamayo R1 (10B parameters) across 1,996 scenarios under eight sensor perturbations (Gaussian noise at four intensities, two lighting extremes, and two fog levels; ${\sim}18{,}000$ inference trials). We find that reasoning consistency is a high-fidelity indicator of trajectory reliability: when Chain-of-Causation (CoC) explanations change after perturbation, trajectory deviation spikes $5.3{\times}$ (21.8m vs 4.1m), with $r!=!0.99$ across attack types and $r_{pb}!=!0.53$ per-sample (Cohen's $d!=!1.12$). A controlled ablation provides evidence that enabling CoC generation is associated with improved trajectory accuracy (11.8% on average across conditions; $p < 0.0001$) under matched inference settings. Over the tested noise range ($σ\in {10, 30, 50, 70}$), degradation is approximately linear ($R^2!=!0.957$), while standard input preprocessing defenses provide only marginal relief. Together, these results establish CoC consistency as a quantitative proxy for planning safety and motivate reasoning-based runtime monitoring for safer VLA deployment.

Lost in Fog: Sensor Perturbations Expose Reasoning Fragility in Driving VLAs

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理