SafeGuard ASF: SR Agentic Humanoid Robot System for Autonomous Industrial Safety

📄 arXiv: 2603.25353v1 📥 PDF

作者: Thanh Nguyen Canh, Thang Tran Viet, Thanh Tuan Tran, Ben Wei Lim

分类: cs.RO

发布日期: 2026-03-26


💡 一句话要点

SafeGuard ASF:用于自主工业安全的具身智能人形机器人系统

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: 人形机器人 自主安全 具身智能 多模态感知 强化学习

📋 核心要点

  1. 现有“黑暗工厂”缺乏自主安全系统,难以检测和响应多种危险。
  2. SafeGuard ASF集成了多模态感知、ReAct推理和学习的运动策略,实现自主危险检测。
  3. 系统在模拟和真实环境中验证,展示了自主巡逻、人体检测和避障能力。

📝 摘要(中文)

本文提出SafeGuard ASF(Agentic Security Fleet),一个综合框架,旨在部署人形机器人于工业环境中进行自主危险检测。该系统集成了多模态感知(RGB-D成像)、基于ReAct的具身智能推理框架以及在Unitree G1人形机器人平台上学习的运动策略。系统针对三个关键危险场景:火灾和烟雾检测、管道异常温度监测以及禁区入侵者检测。感知管道在127毫秒延迟下实现了94.2%的火灾或烟雾检测mAP。使用Unitree RL Lab和PPO训练了包括舞蹈动作跟踪和速度控制在内的多种运动策略,在80,000次训练迭代内表现出稳定的收敛性。在模拟和真实环境中验证了该系统,展示了自主巡逻、基于视觉感知的人体检测和避障能力。提出的ToolOrchestra动作框架通过感知、推理和执行工具实现了结构化的决策。

🔬 方法详解

问题定义:论文旨在解决在无人值守的工业环境中,如何利用人形机器人实现自主安全监控的问题。现有方法通常依赖于固定的传感器网络或人工巡检,存在覆盖范围有限、响应速度慢、成本高等痛点。人形机器人有望通过其灵活性和移动性,更有效地进行危险检测和响应。

核心思路:论文的核心思路是构建一个集感知、推理和执行于一体的具身智能系统。通过多模态感知获取环境信息,利用ReAct框架进行推理和决策,并控制人形机器人执行相应的动作。这种设计旨在使机器人能够像人类一样,根据环境变化自主地进行安全巡检和应急响应。

技术框架:SafeGuard ASF系统主要包含以下几个模块:1) 多模态感知模块:利用RGB-D相机获取环境的视觉和深度信息,用于火灾/烟雾检测、温度监测和入侵者检测。2) ReAct推理模块:基于ReAct框架,机器人根据感知到的信息进行推理,并生成相应的动作指令。3) 运动控制模块:利用强化学习训练的运动策略,控制Unitree G1人形机器人执行巡逻、避障等动作。4) ToolOrchestra动作框架:用于协调感知、推理和执行工具,实现结构化的决策过程。

关键创新:该论文的关键创新在于将具身智能推理框架ReAct与人形机器人平台相结合,实现自主安全监控。与传统的基于规则或预编程的机器人系统相比,SafeGuard ASF能够更好地适应复杂和动态的工业环境。此外,ToolOrchestra动作框架提供了一种结构化的决策方法,提高了系统的可靠性和可解释性。

关键设计:在感知模块中,使用了深度学习模型进行火灾/烟雾检测,并优化了模型的推理速度。在运动控制模块中,使用Unitree RL Lab和PPO算法训练了多种运动策略,包括舞蹈动作跟踪和速度控制。训练过程中,通过调整奖励函数和探索策略,提高了运动策略的稳定性和收敛速度。ReAct框架中的prompt设计和tool的选择也对系统的性能有重要影响。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,SafeGuard ASF的感知管道在127毫秒延迟下实现了94.2%的火灾或烟雾检测mAP。通过强化学习训练的运动策略在80,000次训练迭代内表现出稳定的收敛性。在模拟和真实环境中的验证表明,该系统能够自主巡逻、检测人体和避开障碍物,验证了其在实际应用中的可行性。

🎯 应用场景

SafeGuard ASF可应用于各种无人值守的工业环境,如“黑暗工厂”、仓库、化工厂等。该系统能够自主进行安全巡检,及时发现并响应火灾、泄漏、入侵等危险情况,从而降低事故风险,保障人员和财产安全。未来,该技术有望扩展到其他领域,如灾害救援、安防巡逻等。

📄 摘要(原文)

The rise of unmanned ``dark factories'' operating without human presence demands autonomous safety systems capable of detecting and responding to multiple hazard types. We present SafeGuard ASF (Agentic Security Fleet), a comprehensive framework deploying humanoid robots for autonomous hazard detection in industrial environments. Our system integrates multi-modal perception (RGB-D imaging), a ReAct-based agentic reasoning framework, and learned locomotion policies on the Unitree G1 humanoid platform. We address three critical hazard scenarios: fire and smoke detection, abnormal temperature monitoring in pipelines, and intruder detection in restricted zones. Our perception pipeline achieves 94.2% mAP for fire or smoke detection with 127ms latency. We train multiple locomotion policies, including dance motion tracking and velocity control, using Unitree RL Lab with PPO, demonstrating stable convergence within 80,000 training iterations. We validate our system in both simulation and real-world environments, demonstrating autonomous patrol, human detection with visual perception, and obstacle avoidance capabilities. The proposed ToolOrchestra action framework enables structured decision-making through perception, reasoning, and actuation tools.