GuardAD: Safeguarding Autonomous Driving MLLMs via Markovian Safety Logic
作者: Tianyuan Zhang, Peng Yue, Zihao Peng, Jiangfan Liu, Zonghao Ying, Jiakai Wang, Tianlin Li, Jian Yang, Yaodong Yang, Aishan Liu, Xianglong Liu
分类: cs.AI
发布日期: 2026-05-11
💡 一句话要点
提出GuardAD以解决自动驾驶系统安全性问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自动驾驶 安全保障 大语言模型 马尔可夫逻辑 多模态融合 神经-符号逻辑 智能交通系统 动态推理
📋 核心要点
- 现有方法多依赖静态逻辑约束,缺乏对动态交通场景的适应性,难以满足复杂驾驶环境的安全需求。
- GuardAD提出了基于马尔可夫逻辑的动态安全状态建模方法,能够检测并引导潜在危险。
- 实验证明GuardAD在多项基准测试中事故率降低32.07%,任务性能提升6.85%,表现出强大的应用前景。
📝 摘要(中文)
多模态大语言模型(MLLMs)在自动驾驶系统中的应用日益增加,但在事故高危场景中仍面临多种安全威胁。现有的安全机制多依赖静态形式的逻辑约束,缺乏对动态交通交互的时效性安全推理,导致在动态驾驶环境中鲁棒性有限。为了解决这些局限性,我们提出了GuardAD,这是一种模型无关的安全保障机制,将自动驾驶安全性建模为不断演变的马尔可夫逻辑状态。GuardAD引入了神经-符号逻辑形式化,能够针对异构交通参与者持续诱导安全谓词,从而推断超出单步观察的潜在风险。实验结果表明,GuardAD显著降低事故率(-32.07%),同时微幅提升任务性能(+6.85%)。
🔬 方法详解
问题定义:论文重点解决自动驾驶系统在动态驾驶环境中面临的安全性挑战,现有方法缺乏时效性推理,导致对潜在危险的检测和响应能力不足。
核心思路:GuardAD通过将安全性建模为演变的马尔可夫逻辑状态,结合神经-符号逻辑形式化,增强了对异构交通参与者的安全推理能力,从而实现动态环境下的鲁棒性。
技术框架:GuardAD的整体架构包括三个主要模块:安全谓词建模、马尔可夫逻辑诱导和逻辑驱动行动修正。通过这些模块,系统能够持续更新安全状态并指导驾驶决策。
关键创新:GuardAD的核心创新在于其动态马尔可夫逻辑建模方式,不同于以往静态的逻辑约束,不仅对单步观察进行推理,还能发现潜在的、隐蔽的危险情形。
关键设计:关键参数设置包括时间序列的数据类别、损失函数的设计采用逻辑一致性等,确保了模型在推理过程中能够有效处理多变的驾驶环境。其网络结构设计上,采用了神经网络与符号逻辑相结合的方法,增强了安全性推理的深度与广度。
🖼️ 关键图片
📊 实验亮点
实验结果显示,GuardAD在多个基准测试中有效降低了事故率32.07%,同时实现了任务性能的提升6.85%。这种显著的安全性改善和性能优化彰显了GuardAD的有效性和重要应用价值。
🎯 应用场景
GuardAD在自动驾驶领域的潜在应用包括智能交通系统、无人驾驶出租车及交警指挥中心等。其有效的安全保障机制能够显著提升自动驾驶技术的可靠性和安全性,促进该领域的进一步发展与应用,预防交通事故的发生。
📄 摘要(原文)
Multimodal large language models (MLLMs) are increasingly integrated into autonomous driving (AD) systems; however, they remain vulnerable to diverse safety threats, particularly in accident-prone scenarios. Recent safeguard mechanisms have shown promise by incorporating logical constraints, yet most rely on static formulations that lack temporally grounded safety reasoning over evolving traffic interactions, resulting in limited robustness in dynamic driving environments. To address these limitations, we propose GuardAD, a model-agnostic safeguard that formulates AD safety as an evolving Markovian logical state. GuardAD introduces Neuro-Symbolic Logic Formalization, which represents safety predicates over heterogeneous traffic participants and continuously induces them via n-th order Markovian Logic Induction. This design enables the inference of emerging and latent hazards beyond single-step observations. Rather than simply vetoing unsafe actions, GuardAD performs Logic-Driven Action Revision, where inferred safety states actively guide action refinement without modifying the underlying MLLM. Extensive experiments on multiple benchmarks and AD-MLLMs demonstrate that GuardAD substantially reduces accident rates (-32.07%) while slightly improving task performance (+6.85%). Moreover, closed-loop simulation evaluations, together with physical-world vehicle studies, further validate the effectiveness and potential of GuardAD.