LLM-Guided Safety Agent for Edge Robotics with an ISO-Compliant Perception-Compute-Control Architecture
作者: Xu Huang, Ruofan Zhang, Lu Cheng, Yuefeng Song, Xu Huang, Huayu Zhang, Sheng Yin, Anyang Liang, Chen Qian, Yin Zhou, Xiaoyun Yuan, Yuan Cheng
分类: cs.RO
发布日期: 2026-04-22
💡 一句话要点
提出LLM引导的安全代理,用于符合ISO标准的边缘机器人人机交互安全
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 人机交互 功能安全 边缘计算 大型语言模型 机器人控制
📋 核心要点
- 人机交互中的功能安全保障面临挑战,因为AI感知具有概率性,而工业标准要求确定性行为。
- 利用LLM将自然语言安全规则转化为可执行谓词,并通过冗余异构边缘运行时部署,实现安全保障。
- 在双RK3588平台上验证,结果表明该系统能够以经济高效的硬件实现ISO 13849 Category 3和PL d。
📝 摘要(中文)
本文提出了一种由LLM引导的边缘机器人安全代理,该代理构建于符合ISO标准的低延迟感知-计算-控制架构之上。该方法将自然语言安全规则转换为可执行的谓词,并通过冗余的异构边缘运行时进行部署。为了在边缘约束下实现容错闭环执行,采用了对称的双模块冗余设计,对低延迟感知、计算和控制进行并行独立执行。该系统在双RK3588平台上进行了原型设计,并在典型的人机交互场景中进行了评估。结果表明,使用经济高效的硬件,可以实现符合ISO 13849 Category 3和PL d的实用边缘实施路径,从而支持安全关键型具身AI的实际部署。
🔬 方法详解
问题定义:论文旨在解决人机交互中机器人功能安全的问题。现有AI感知的概率性与工业标准对确定性行为的要求相悖,导致难以满足安全标准。传统方法难以将自然语言描述的安全规则转化为机器人可执行的指令,并且缺乏在边缘设备上实现容错和低延迟执行的有效方案。
核心思路:论文的核心思路是利用大型语言模型(LLM)将自然语言安全规则转化为可执行的谓词,并结合冗余的异构边缘计算架构,实现安全规则的低延迟、容错执行。通过LLM理解安全规则的语义,并将其转化为机器人可以理解和执行的逻辑表达式,从而弥合了自然语言描述和机器人控制之间的差距。
技术框架:该系统的整体架构包括以下几个主要模块:1) 感知模块:负责从传感器获取环境信息;2) LLM引导的安全代理:将自然语言安全规则转化为可执行的谓词;3) 计算模块:执行安全谓词,并进行决策;4) 控制模块:根据决策结果控制机器人运动。为了实现容错和低延迟,系统采用了对称的双模块冗余设计,即感知、计算和控制模块都存在两个独立的实例,并行执行,并通过比较结果来检测和纠正错误。
关键创新:该论文的关键创新在于:1) 利用LLM将自然语言安全规则转化为可执行的谓词,实现了安全规则的自动化部署;2) 采用对称的双模块冗余设计,提高了系统的容错能力和可靠性;3) 在边缘设备上实现了低延迟的感知、计算和控制,满足了人机交互的实时性要求。与现有方法相比,该方法能够更灵活地定义和部署安全规则,并且能够在资源受限的边缘环境中实现安全保障。
关键设计:论文中关键的设计包括:1) LLM的选择和微调:选择合适的LLM,并针对安全规则的特点进行微调,以提高其理解和转化能力;2) 安全谓词的定义:设计一套完整的安全谓词,用于描述各种安全规则;3) 冗余模块的同步和比较机制:确保冗余模块的输入一致,并设计有效的比较机制来检测和纠正错误;4) 低延迟优化:针对边缘设备的计算能力和网络带宽进行优化,以降低系统的延迟。
🖼️ 关键图片
📊 实验亮点
该系统在双RK3588平台上进行了原型设计,并在典型的人机交互场景中进行了评估。实验结果表明,该系统能够以经济高效的硬件实现符合ISO 13849 Category 3和PL d的安全等级,验证了该方法在实际应用中的可行性。具体的性能数据(如延迟、容错率等)未在摘要中明确给出,属于未知信息。
🎯 应用场景
该研究成果可应用于各种人机协作场景,例如工业机器人、服务机器人、医疗机器人等。通过将自然语言安全规则转化为机器人可执行的指令,可以提高人机交互的安全性,降低事故发生的风险。此外,该方法还可以在资源受限的边缘环境中实现安全保障,为安全关键型具身AI的实际部署提供了可能。
📄 摘要(原文)
Ensuring functional safety in human-robot interaction is challenging because AI perception is inherently probabilistic, whereas industrial standards require deterministic behavior. We present an LLM-guided safety agent for edge robotics, built on an ISO-compliant low-latency perception-compute-control architecture. Our method translates natural-language safety regulations into executable predicates and deploys them through a redundant heterogeneous edge runtime. For fault-tolerant closed-loop execution under edge constraints, we adopt a symmetric dual-modular redundancy design with parallel independent execution for low-latency perception, computation, and control. We prototype the system on a dual-RK3588 platform and evaluate it in representative human-robot interaction scenarios. The results demonstrate a practical edge implementation path toward ISO 13849 Category 3 and PL d using cost-effective hardware, supporting practical deployment of safety-critical embodied AI.