SENSE-STEP: Learning Sim-to-Real Locomotion for a Sensory-Enabled Soft Quadruped Robot
作者: Storm de Kam, Ebrahim Shahabi, Cosimo Della Santina
分类: cs.RO
发布日期: 2026-02-13
💡 一句话要点
SENSE-STEP:面向软体四足机器人,学习基于触觉感知的Sim-to-Real运动控制
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 软体机器人 四足机器人 运动控制 触觉感知 Sim-to-Real
📋 核心要点
- 软体四足机器人运动控制面临高维动力学、执行器滞后和复杂接触交互等难题,传统本体感觉信息不足。
- 提出SENSE-STEP框架,利用触觉吸盘足,结合本体感觉和触觉反馈,学习闭环控制策略。
- 实验表明,该方法在真实机器人上显著提升了运动速度,尤其在倾斜表面上效果显著,触觉反馈至关重要。
📝 摘要(中文)
由于高维动力学、执行器迟滞和难以建模的接触交互,对于软体四足机器人而言,鲁棒的闭环运动仍然具有挑战性,而传统的本体感觉提供的关于地面接触的信息有限。本文提出了一种基于学习的控制框架,用于配备触觉吸盘足的气动软体四足机器人,并在物理硬件上通过实验验证了该方法。控制策略在仿真环境中通过分阶段的学习过程进行训练,该过程从参考步态开始,并在随机环境条件下逐步细化。由此产生的控制器将本体感觉和触觉反馈映射到协调的气动驱动和吸盘命令,从而在平面和倾斜表面上实现闭环运动。当部署在真实机器人上时,闭环策略优于开环基线,在平面上前进速度提高了41%,在5度倾斜面上提高了91%。消融研究进一步证明了触觉力估计和惯性反馈在稳定运动中的作用,与没有感觉反馈的配置相比,性能提高了高达56%。
🔬 方法详解
问题定义:软体四足机器人的运动控制,尤其是在复杂地形下的鲁棒运动,是一个具有挑战性的问题。现有的方法往往依赖于精确的动力学模型,但软体机器人的高维动力学、执行器迟滞以及与环境的复杂接触难以准确建模。此外,传统的本体感觉(如关节角度和速度)无法提供足够的关于地面接触的信息,限制了闭环控制的性能。
核心思路:本文的核心思路是利用触觉信息来增强软体四足机器人的运动控制。通过在机器人足部配备触觉吸盘,机器人可以直接感知与地面的接触力,从而弥补本体感觉的不足。结合本体感觉和触觉信息,通过学习的方法训练一个闭环控制策略,实现更鲁棒的运动控制。
技术框架:SENSE-STEP框架包含以下几个主要阶段:1) 仿真环境搭建:构建一个逼真的软体四足机器人仿真环境,包括机器人模型、环境模型和物理引擎。2) 分阶段学习:采用分阶段的学习策略,首先学习一个参考步态,然后逐步在随机环境条件下进行优化。3) 控制器训练:使用强化学习或监督学习等方法,训练一个将本体感觉和触觉反馈映射到气动驱动和吸盘命令的控制器。4) Sim-to-Real迁移:将训练好的控制器迁移到真实机器人上,并进行微调。
关键创新:该方法最重要的技术创新点在于将触觉信息融入到软体四足机器人的运动控制中。与传统的仅依赖本体感觉的方法相比,该方法能够更准确地感知与环境的接触,从而实现更鲁棒的运动控制。此外,分阶段的学习策略也有助于提高学习效率和稳定性。
关键设计:在仿真环境中,需要对机器人模型、环境模型和物理引擎进行精确的参数设置。在控制器训练中,需要选择合适的强化学习算法(如PPO或SAC)或监督学习算法,并设计合适的奖励函数或损失函数。此外,还需要设计合适的网络结构,以便有效地提取本体感觉和触觉信息,并将其映射到控制命令。触觉吸盘的设计也至关重要,需要保证其能够提供准确的接触力信息。
📊 实验亮点
实验结果表明,SENSE-STEP框架在真实机器人上显著提升了运动性能。在平面上,闭环策略比开环基线提高了41%的前进速度;在5度倾斜面上,前进速度提高了91%。消融研究表明,触觉力估计和惯性反馈对稳定运动至关重要,与没有感觉反馈的配置相比,性能提高了高达56%。这些结果验证了该方法的有效性和触觉信息的重要性。
🎯 应用场景
该研究成果可应用于复杂地形下的搜索救援、环境监测、农业采摘等领域。软体机器人具有良好的环境适应性和安全性,结合触觉感知和学习控制,能够使其在复杂环境中执行任务,例如在地震废墟中搜寻幸存者,或在崎岖山地上进行环境监测。该研究也为其他类型的软体机器人控制提供了借鉴。
📄 摘要(原文)
Robust closed-loop locomotion remains challenging for soft quadruped robots due to high-dimensional dynamics, actuator hysteresis, and difficult-to-model contact interactions, while conventional proprioception provides limited information about ground contact. In this paper, we present a learning-based control framework for a pneumatically actuated soft quadruped equipped with tactile suction-cup feet, and we validate the approach experimentally on physical hardware. The control policy is trained in simulation through a staged learning process that starts from a reference gait and is progressively refined under randomized environmental conditions. The resulting controller maps proprioceptive and tactile feedback to coordinated pneumatic actuation and suction-cup commands, enabling closed-loop locomotion on flat and inclined surfaces. When deployed on the real robot, the closed-loop policy outperforms an open-loop baseline, increasing forward speed by 41% on a flat surface and by 91% on a 5-degree incline. Ablation studies further demonstrate the role of tactile force estimates and inertial feedback in stabilizing locomotion, with performance improvements of up to 56% compared to configurations without sensory feedback.