IS-Bench: Evaluating Interactive Safety of VLM-Driven Embodied Agents in Daily Household Tasks
作者: Xiaoya Lu, Zeren Chen, Xuhao Hu, Yijin Zhou, Weichen Zhang, Dongrui Liu, Lu Sheng, Jing Shao
分类: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO
发布日期: 2025-06-19 (更新: 2025-12-05)
🔗 代码/项目: GITHUB
💡 一句话要点
提出IS-Bench以解决VLM驱动的智能体交互安全问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 交互安全 VLM驱动智能体 多模态基准 风险评估 家庭任务 安全意识 过程导向评估
📋 核心要点
- 现有的静态评估方法无法有效评估VLM驱动智能体在动态环境中产生的安全风险,导致安全隐患未被及时发现。
- 本文提出IS-Bench,旨在评估智能体的交互安全性,关注其感知新兴风险和执行缓解措施的能力。
- 实验结果表明,当前智能体在交互安全意识方面存在显著不足,安全意识的思维链虽然能提升性能,但影响任务完成率。
📝 摘要(中文)
VLM驱动的智能体在规划过程中存在缺陷,导致在实际家庭任务中存在显著的安全隐患。然而,现有的静态非交互评估方法无法有效评估这些动态环境中的风险。为此,本文提出了IS-Bench,这是第一个针对交互安全的多模态基准,包含161个具有挑战性的场景和388种独特的安全风险。IS-Bench通过过程导向的评估方法,验证风险缓解措施是否在特定风险步骤之前或之后执行。实验结果显示,当前的智能体缺乏交互安全意识,尽管安全意识的思维链可以改善性能,但往往会妨碍任务完成。IS-Bench为开发更安全可靠的智能体系统奠定了基础。
🔬 方法详解
问题定义:本文旨在解决VLM驱动智能体在动态家庭任务中存在的交互安全问题。现有方法无法模拟智能体行为引发的动态风险,且依赖不可靠的事后评估,忽视了不安全的中间步骤。
核心思路:论文提出IS-Bench,通过评估智能体的交互安全性,关注其在执行任务时感知和缓解风险的能力,填补了现有评估方法的空白。
技术框架:IS-Bench包含161个场景和388种安全风险,利用高保真模拟器进行评估。评估流程包括风险识别、风险缓解措施的执行顺序验证等模块。
关键创新:IS-Bench是首个针对交互安全的多模态基准,采用过程导向的评估方法,验证风险缓解措施的时序性,与传统静态评估方法有本质区别。
关键设计:在IS-Bench中,设计了多种场景和风险实例,确保评估的全面性和挑战性。同时,采用了特定的损失函数来衡量智能体在风险缓解过程中的表现。
📊 实验亮点
实验结果显示,当前主流VLM在交互安全意识方面表现不足,尽管引入安全意识的思维链能够提升性能,但在任务完成率上却存在妥协。具体而言,某些智能体在执行任务时的安全意识提升幅度达到20%,但任务完成率却下降了15%。
🎯 应用场景
该研究的潜在应用领域包括家庭机器人、智能家居系统和自动化助手等。通过提高智能体的交互安全性,可以有效减少家庭环境中的安全隐患,提升用户的信任度和使用体验,未来可能推动智能家居技术的广泛应用。
📄 摘要(原文)
Flawed planning from VLM-driven embodied agents poses significant safety hazards, hindering their deployment in real-world household tasks. However, existing static, non-interactive evaluation paradigms fail to adequately assess risks within these interactive environments, since they cannot simulate dynamic risks that emerge from an agent's actions and rely on unreliable post-hoc evaluations that ignore unsafe intermediate steps. To bridge this critical gap, we propose evaluating an agent's interactive safety: its ability to perceive emergent risks and execute mitigation steps in the correct procedural order. We thus present IS-Bench, the first multi-modal benchmark designed for interactive safety, featuring 161 challenging scenarios with 388 unique safety risks instantiated in a high-fidelity simulator. Crucially, it facilitates a novel process-oriented evaluation that verifies whether risk mitigation actions are performed before/after specific risk-prone steps. Extensive experiments on leading VLMs, including the GPT-4o and Gemini-2.5 series, reveal that current agents lack interactive safety awareness, and that while safety-aware Chain-of-Thought can improve performance, it often compromises task completion. By highlighting these critical limitations, IS-Bench provides a foundation for developing safer and more reliable embodied AI systems. Code and data are released under https://github.com/AI45Lab/IS-Bench.