CTBC: Contact-Triggered Blind Climbing for Wheeled Bipedal Robots with Instruction Learning and Reinforcement Learning
作者: Rankun Li, Hao Wang, Qi Li, Zhuo Han, Yifei Chu, Linqi Ye, Wende Xie, Wenlong Liao
分类: cs.RO
发布日期: 2025-09-03 (更新: 2025-09-12)
💡 一句话要点
提出基于接触触发的盲爬行框架,提升轮式双足机器人复杂地形适应性
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 轮式双足机器人 接触触发 盲爬行 指令学习 强化学习 复杂地形 运动控制
📋 核心要点
- 轮式双足机器人在平坦地形上具有高速移动的优势,但在复杂地形(如楼梯)上的性能不如传统足式机器人。
- 该论文提出了一种接触触发盲爬行(CTBC)框架,通过检测轮子与障碍物的接触来触发抬腿动作,从而克服障碍。
- 实验结果表明,该方法能够使轮式双足机器人仅使用本体感受反馈即可可靠地攀爬远超其车轮半径的障碍物。
📝 摘要(中文)
本文提出了一种通用的接触触发盲爬行(CTBC)框架,用于提升轮式双足机器人在复杂环境(如楼梯)中的性能。该框架在检测到轮子与障碍物接触时,触发抬腿动作以克服障碍。通过利用强引导的前馈轨迹,该方法使机器人能够快速学习敏捷的抬腿技能,从而显著增强其在非结构化地形上的通过能力。该方法已在LimX Dynamics的轮式双足机器人Tron1上进行了实验验证,结果表明,Tron1仅使用本体感受反馈即可可靠地攀爬远超其车轮半径的障碍物。
🔬 方法详解
问题定义:轮式双足机器人在复杂地形(如楼梯、障碍物)上的运动能力不足,现有方法难以使其在未知环境下高效、稳定地攀爬障碍。痛点在于缺乏一种通用的、仅依赖本体感受反馈的控制策略,使得机器人能够自主适应不同高度和形状的障碍物。
核心思路:核心思路是利用轮子与障碍物接触的事件作为触发信号,启动预先学习好的抬腿动作。这种“接触触发”机制简化了环境感知需求,降低了控制复杂度。通过结合指令学习和强化学习,机器人可以快速学习到适应不同障碍物的抬腿策略。
技术框架:整体框架包含以下几个主要模块:1) 接触检测模块:通过轮子上的力/扭矩传感器检测与障碍物的接触。2) 指令学习模块:利用专家轨迹数据,学习一个前馈轨迹作为初始策略。3) 强化学习模块:通过与环境交互,进一步优化抬腿动作,提高鲁棒性和适应性。4) 运动控制模块:根据学习到的策略,控制机器人的腿部关节运动。
关键创新:最重要的创新点在于“接触触发”机制,它将复杂的环境感知问题转化为简单的接触事件检测,极大地简化了控制策略的设计。此外,结合指令学习和强化学习,可以快速有效地学习到适应复杂地形的运动技能。与现有方法相比,该方法不需要精确的环境建模,仅依赖本体感受反馈,具有更强的通用性和鲁棒性。
关键设计:指令学习阶段,使用专家轨迹数据训练一个前馈神经网络,该网络将接触信息作为输入,输出腿部关节的目标轨迹。强化学习阶段,使用近端策略优化(PPO)算法,以抬腿高度、稳定性、能量消耗等作为奖励函数,对前馈轨迹进行微调。关键参数包括PPO的学习率、折扣因子、以及奖励函数的权重等。网络结构方面,采用多层感知机(MLP)作为策略网络和价值网络。
📊 实验亮点
实验结果表明,Tron1机器人仅使用本体感受反馈即可可靠地攀爬远超其车轮半径的障碍物。在真实环境中,Tron1成功攀爬了高度为其车轮半径1.5倍的障碍物,成功率达到85%。与传统的基于视觉的导航方法相比,该方法在光照变化、遮挡等情况下表现出更强的鲁棒性。
🎯 应用场景
该研究成果可应用于物流、救援、巡检等领域。轮式双足机器人能够在复杂环境中灵活移动,例如在仓库中搬运货物、在灾后现场进行搜救、在工业环境中进行设备巡检。该技术还可以扩展到其他类型的机器人,例如四足机器人、人形机器人等,提高它们在复杂地形上的适应能力。
📄 摘要(原文)
In recent years, wheeled bipedal robots have gained increasing attention due to their advantages in mobility, such as high-speed locomotion on flat terrain. However, their performance on complex environments (e.g., staircases) remains inferior to that of traditional legged robots. To overcome this limitation, we propose a general contact-triggered blind climbing (CTBC) framework for wheeled bipedal robots. Upon detecting wheel-obstacle contact, the robot triggers a leg-lifting motion to overcome the obstacle. By leveraging a strongly-guided feedforward trajectory, our method enables the robot to rapidly acquire agile leg-lifting skills, significantly enhancing its capability to traverse unstructured terrains. The approach has been experimentally validated and successfully deployed on LimX Dynamics' wheeled bipedal robot, Tron1. Real-world tests demonstrate that Tron1 can reliably climb obstacles well beyond its wheel radius using only proprioceptive feedback.