SpecGuard: Specification Aware Recovery for Robotic Autonomous Vehicles from Physical Attacks
作者: Pritam Dash, Ethan Chan, Karthik Pattabiraman
分类: cs.RO, cs.CR, eess.SY
发布日期: 2024-08-27
备注: CCS'24 (a shorter version of this paper will appear in the conference proceeding)
💡 一句话要点
SpecGuard:针对物理攻击,为机器人自主车辆提供规范感知的恢复方案
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 机器人自主车辆 物理攻击恢复 深度强化学习 任务规范 状态重建
📋 核心要点
- 机器人自主车辆易受物理攻击,导致传感器数据损坏和任务失败,现有方法难以在攻击下保证任务规范。
- SpecGuard通过深度强化学习学习恢复控制策略,并结合任务规范设计奖励函数,确保恢复过程符合安全约束。
- SpecGuard采用状态重建技术减少传感器扰动,并进行对抗训练,在虚拟和真实环境中实现了更高的恢复成功率。
📝 摘要(中文)
机器人自主车辆(RAV)依赖传感器进行感知,并遵循严格的任务规范(例如,高度、速度和地理围栏约束)以确保安全和及时的运行。物理攻击会破坏RAV的传感器,导致任务失败。从这种攻击中恢复RAV需要强大的控制技术,即使在攻击下也能保持符合任务规范,以确保RAV的安全和及时运行。我们提出了SpecGuard,一种符合任务规范并执行RAV安全恢复的技术。SpecGuard包含两个创新点。首先,它引入了一种结合任务规范的方法,并使用深度强化学习(Deep-RL)学习恢复控制策略。我们设计了一种基于合规性的奖励结构,反映了RAV的复杂动力学,并使SpecGuard能够同时满足多个任务规范。其次,SpecGuard结合了状态重建技术,最大限度地减少攻击引起的传感器扰动。这种重建能够进行有效的对抗训练,并优化恢复控制策略,以提高在攻击下的鲁棒性。我们在虚拟和真实的RAV中评估了SpecGuard,发现它在不同传感器的攻击下实现了92%的恢复成功率,且没有发生任何崩溃或停顿。SpecGuard的恢复成功率比先前的工作高2倍,并且在真实的RAV上产生了约15%的性能开销。
🔬 方法详解
问题定义:论文旨在解决机器人自主车辆(RAV)在遭受物理攻击导致传感器数据损坏时,如何安全可靠地恢复并完成任务的问题。现有方法在应对此类攻击时,难以同时兼顾任务规范(如高度、速度限制)和恢复成功率,容易导致车辆坠毁或停滞。
核心思路:论文的核心思路是设计一个规范感知的恢复控制策略,该策略能够利用深度强化学习(Deep-RL)学习在攻击下安全恢复车辆的控制策略,同时确保满足预定的任务规范。通过结合任务规范设计奖励函数,引导智能体学习符合安全约束的动作。
技术框架:SpecGuard的整体框架包含两个主要模块:1) 基于合规性的深度强化学习恢复控制策略学习模块;2) 状态重建模块。首先,利用状态重建模块最小化攻击引起的传感器扰动,然后,将重建后的状态输入到深度强化学习智能体中,智能体根据当前状态和任务规范选择动作,并获得相应的奖励。通过不断学习,智能体最终能够学会在攻击下安全恢复车辆的控制策略。
关键创新:SpecGuard的关键创新在于:1) 将任务规范融入到深度强化学习的奖励函数设计中,使得智能体在学习过程中能够感知并遵守任务规范;2) 引入状态重建技术,减少攻击对传感器数据的影响,提高恢复控制策略的鲁棒性。与现有方法相比,SpecGuard能够更好地平衡恢复成功率和任务规范的遵守。
关键设计:SpecGuard的关键设计包括:1) 基于合规性的奖励函数:奖励函数的设计考虑了RAV的复杂动力学和多个任务规范,例如,偏离高度或速度限制会受到惩罚;2) 状态重建网络:状态重建网络旨在从受损的传感器数据中恢复真实状态,采用自编码器结构,通过最小化重建误差来学习状态的潜在表示;3) 对抗训练:为了提高恢复控制策略的鲁棒性,SpecGuard采用对抗训练,即在训练过程中模拟各种可能的攻击,并训练智能体在这些攻击下也能成功恢复。
🖼️ 关键图片
📊 实验亮点
SpecGuard在虚拟和真实RAV上的实验结果表明,其在不同传感器的攻击下实现了92%的恢复成功率,且没有发生任何崩溃或停顿。与先前的工作相比,SpecGuard的恢复成功率提高了2倍,并且在真实的RAV上产生了约15%的性能开销。这些结果表明,SpecGuard能够有效地提高RAV在攻击下的安全性和可靠性。
🎯 应用场景
SpecGuard技术可应用于各种机器人自主车辆,例如无人机、无人车等,尤其适用于需要在复杂或危险环境中执行任务的场景,如灾害救援、环境监测、物流运输等。该技术能够提高自主车辆在面对恶意攻击或意外故障时的安全性和可靠性,具有重要的实际应用价值和广阔的应用前景。
📄 摘要(原文)
Robotic Autonomous Vehicles (RAVs) rely on their sensors for perception, and follow strict mission specifications (e.g., altitude, speed, and geofence constraints) for safe and timely operations. Physical attacks can corrupt the RAVs' sensors, resulting in mission failures. Recovering RAVs from such attacks demands robust control techniques that maintain compliance with mission specifications even under attacks to ensure the RAV's safety and timely operations. We propose SpecGuard, a technique that complies with mission specifications and performs safe recovery of RAVs. There are two innovations in SpecGuard. First, it introduces an approach to incorporate mission specifications and learn a recovery control policy using Deep Reinforcement Learning (Deep-RL). We design a compliance-based reward structure that reflects the RAV's complex dynamics and enables SpecGuard to satisfy multiple mission specifications simultaneously. Second, SpecGuard incorporates state reconstruction, a technique that minimizes attack induced sensor perturbations. This reconstruction enables effective adversarial training, and optimizing the recovery control policy for robustness under attacks. We evaluate SpecGuard in both virtual and real RAVs, and find that it achieves 92% recovery success rate under attacks on different sensors, without any crashes or stalls. SpecGuard achieves 2X higher recovery success than prior work, and incurs about 15% performance overhead on real RAVs.