Teleoperator-Aware and Safety-Critical Adaptive Nonlinear MPC for Shared Autonomy in Obstacle Avoidance of Legged Robots
作者: Ruturaj Sambhus, Muneeb Ahmad, Basit Muhammad Imran, Sujith Vijayan, Dylan P. Losey, Kaveh Akbari Hamed
分类: cs.RO, math.OC
发布日期: 2025-09-26
💡 一句话要点
提出一种遥操作感知的安全自适应非线性MPC框架,用于腿式机器人在避障中的共享自主。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 腿式机器人 共享自主 遥操作 模型预测控制 控制障碍函数
📋 核心要点
- 传统共享控制方法难以捕捉腿式机器人运动的动态特性,可能危及安全性,因此需要更智能的融合策略。
- 该论文提出了一种自适应非线性模型预测控制框架,通过在线学习人类意图并结合控制障碍函数来保证安全。
- 在Unitree Go2机器人上的实验验证了该框架的实时避障能力、人类意图在线学习能力以及安全遥操作协作能力。
📝 摘要(中文)
本文提出了一种遥操作感知的、安全关键的自适应非线性模型预测控制(ANMPC)框架,用于四足机器人在避障任务中的共享自主。该框架采用人类和机器人动作之间的固定仲裁权重,并通过使用噪声合理的玻尔兹曼模型对人类输入进行建模来增强该方案,该模型的参数使用来自观察到的操纵杆命令的投影梯度下降(PGD)律在线自适应。通过集成到计算高效的NMPC中的控制障碍函数(CBF)约束来强制执行安全性,确保安全集的前向不变性,尽管人类行为存在不确定性。控制架构是分层的:一个高级的基于CBF的ANMPC(10 Hz)生成混合的人类-机器人速度参考,一个中级的动态感知NMPC(60 Hz)强制执行降阶单刚体(SRB)动力学来跟踪这些参考,以及一个低级的非线性全身控制器(500 Hz)通过二次规划来施加全阶动力学以跟踪中级轨迹。在Unitree Go2四足机器人上进行的大量数值和硬件实验以及用户研究验证了该框架,证明了实时避障、人类意图参数的在线学习和安全的遥操作协作。
🔬 方法详解
问题定义:在腿式机器人遥操作的共享自主控制中,如何在复杂环境中安全有效地实现人机协作是一个关键问题。现有方法通常采用固定的融合策略,无法充分考虑腿式机器人的动态特性和人类操作的不确定性,容易导致安全风险。
核心思路:该论文的核心思路是设计一个遥操作感知的、安全关键的自适应非线性模型预测控制(ANMPC)框架。通过在线学习人类操作者的意图,并将其融入到机器人控制中,同时利用控制障碍函数(CBF)来保证机器人的安全性。
技术框架:该框架采用分层控制架构: 1. 高层:基于CBF的ANMPC (10Hz):融合人类和机器人的指令,生成安全的速度参考。 2. 中层:动态感知NMPC (60Hz):利用降阶单刚体(SRB)动力学模型,跟踪高层速度参考。 3. 低层:非线性全身控制器 (500Hz):通过二次规划实现全阶动力学控制,跟踪中层轨迹。
关键创新:该论文的关键创新在于: 1. 遥操作感知:使用噪声合理的玻尔兹曼模型对人类输入进行建模,并通过投影梯度下降(PGD)在线学习人类意图参数。 2. 安全关键:将控制障碍函数(CBF)集成到NMPC中,确保在人类行为不确定情况下,机器人始终保持在安全区域内。 3. 分层控制:采用分层控制架构,将复杂的控制问题分解为多个子问题,降低了计算复杂度,提高了实时性。
关键设计: 1. 玻尔兹曼模型:用于建模人类操作者的意图,其参数通过在线学习进行自适应调整。 2. 控制障碍函数(CBF):用于定义安全区域,并作为约束条件加入到NMPC中,保证安全性。 3. NMPC优化:采用计算高效的NMPC算法,保证实时性。
🖼️ 关键图片
📊 实验亮点
通过在Unitree Go2四足机器人上进行的大量数值和硬件实验,验证了该框架的有效性。实验结果表明,该框架能够实现实时避障、在线学习人类意图参数,并保证安全的遥操作协作。用户研究也表明,该框架能够显著提高人机协作的效率和安全性。
🎯 应用场景
该研究成果可应用于搜救、勘探、巡检等复杂环境下的腿式机器人遥操作任务。通过提高人机协作效率和安全性,可以使机器人在更广泛的场景中发挥作用,例如灾后救援、危险环境探测、以及需要精细操作的工业应用等,具有重要的实际应用价值和广阔的应用前景。
📄 摘要(原文)
Ensuring safe and effective collaboration between humans and autonomous legged robots is a fundamental challenge in shared autonomy, particularly for teleoperated systems navigating cluttered environments. Conventional shared-control approaches often rely on fixed blending strategies that fail to capture the dynamics of legged locomotion and may compromise safety. This paper presents a teleoperator-aware, safety-critical, adaptive nonlinear model predictive control (ANMPC) framework for shared autonomy of quadrupedal robots in obstacle-avoidance tasks. The framework employs a fixed arbitration weight between human and robot actions but enhances this scheme by modeling the human input with a noisily rational Boltzmann model, whose parameters are adapted online using a projected gradient descent (PGD) law from observed joystick commands. Safety is enforced through control barrier function (CBF) constraints integrated into a computationally efficient NMPC, ensuring forward invariance of safe sets despite uncertainty in human behavior. The control architecture is hierarchical: a high-level CBF-based ANMPC (10 Hz) generates blended human-robot velocity references, a mid-level dynamics-aware NMPC (60 Hz) enforces reduced-order single rigid body (SRB) dynamics to track these references, and a low-level nonlinear whole-body controller (500 Hz) imposes the full-order dynamics via quadratic programming to track the mid-level trajectories. Extensive numerical and hardware experiments, together with a user study, on a Unitree Go2 quadrupedal robot validate the framework, demonstrating real-time obstacle avoidance, online learning of human intent parameters, and safe teleoperator collaboration.