Omnidirectional Humanoid Locomotion on Stairs via Unsafe Stepping Penalty and Sparse LiDAR Elevation Mapping
作者: Yuzhi Jiang, Yujun Liang, Junhao Li, Han Ding, Lijun Zhu
分类: cs.RO
发布日期: 2026-03-09
💡 一句话要点
提出基于稀疏LiDAR和不安全步进惩罚的人形机器人楼梯全向行走方法
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics) 支柱八:物理动画 (Physics-based Animation)
关键词: 人形机器人 楼梯行走 全向运动 稀疏LiDAR 强化学习 不安全步进惩罚 点云地图 sim-to-real
📋 核心要点
- 现有方法依赖前向深度相机,存在盲区,限制了人形机器人在楼梯等复杂地形上的全向移动能力。
- 该论文提出了一种单阶段训练框架,结合密集不安全步进惩罚和稀疏LiDAR高程图,实现安全步态。
- 实验结果表明,该方法在仿真和真实环境中均实现了高安全步进率,并验证了其长期稳定性和sim-to-real迁移能力。
📝 摘要(中文)
人形机器人具有高自由度和高重心,本质上是不稳定的。在楼梯上安全地进行全向运动需要全向地形感知和可靠的落脚点选择。现有方法通常依赖于前向深度相机,这会产生盲区,限制全向移动性。此外,稀疏的接触后不安全步进惩罚导致学习效率低和次优策略。为了实现安全的楼梯穿越步态,本文引入了一个单阶段训练框架,该框架结合了密集的不安全步进惩罚,当脚接近危险位置时,提供连续的反馈。为了获得稳定和可靠的高程图,我们构建了一个具有时空置信度衰减和自我保护区机制的滚动点云映射系统,从而产生时间上一致的局部地图。这些地图通过边缘引导的非对称U-Net(EGAU)进一步细化,减轻了由楼梯立管上的稀疏LiDAR返回引起的重建失真。仿真和真实机器人实验表明,所提出的方法在仿真中的楼梯地形上实现了接近100%的安全步进率,同时在实际部署中保持了非常高的安全步进率。此外,它完成了在复杂户外地形上的连续长距离行走测试,证明了可靠的sim-to-real迁移和长期稳定性。
🔬 方法详解
问题定义:人形机器人在楼梯等复杂地形上进行全向行走时,需要解决地形感知和落脚点选择的问题。现有方法依赖前向深度相机,存在盲区,限制了全向移动能力。此外,稀疏的不安全步进惩罚导致学习效率低下,难以获得最优策略。
核心思路:该论文的核心思路是结合稀疏LiDAR点云构建高程图,并利用密集的不安全步进惩罚来指导强化学习,从而实现安全的全向行走。通过LiDAR获取周围环境信息,避免了深度相机的盲区问题,而密集的惩罚函数可以提供更及时的反馈,提高学习效率。
技术框架:整体框架包含两个主要模块:一是基于稀疏LiDAR的滚动点云地图构建系统,用于生成稳定可靠的高程图;二是基于强化学习的步态控制策略,利用高程图和密集不安全步进惩罚进行训练。滚动点云地图构建系统包括时空置信度衰减和自我保护区机制,用于提高地图的稳定性和可靠性。步态控制策略则通过单阶段训练框架,结合密集的不安全步进惩罚来优化步态。
关键创新:该论文的关键创新在于以下几点:1) 提出了密集的不安全步进惩罚,相比于稀疏的惩罚,可以提供更连续和及时的反馈,提高学习效率;2) 设计了滚动点云地图构建系统,结合时空置信度衰减和自我保护区机制,生成稳定可靠的高程图;3) 提出了边缘引导的非对称U-Net(EGAU),用于细化高程图,减轻了由稀疏LiDAR返回引起的重建失真。
关键设计:在滚动点云地图构建系统中,时空置信度衰减用于降低旧点云的影响,提高地图的实时性。自我保护区机制用于防止机器人自身遮挡造成的点云缺失。EGAU网络则利用边缘信息来指导高程图的重建,特别是针对楼梯立管等结构。在强化学习中,密集的不安全步进惩罚被设计为与脚部到危险区域的距离成反比,从而提供连续的反馈信号。
🖼️ 关键图片
📊 实验亮点
仿真实验表明,该方法在楼梯地形上实现了接近100%的安全步进率。真实机器人实验也验证了该方法在实际环境中的有效性,保持了较高的安全步进率。此外,该方法还完成了在复杂户外地形上的连续长距离行走测试,证明了其可靠的sim-to-real迁移能力和长期稳定性。
🎯 应用场景
该研究成果可应用于人形机器人在复杂环境中的导航和操作,例如在灾难救援、建筑巡检、家庭服务等场景中。通过安全可靠的楼梯行走能力,人形机器人可以更好地适应各种复杂地形,完成更加复杂的任务,具有重要的实际应用价值和广阔的应用前景。
📄 摘要(原文)
Humanoid robots, characterized by numerous degrees of freedom and a high center of gravity, are inherently unstable. Safe omnidirectional locomotion on stairs requires both omnidirectional terrain perception and reliable foothold selection. Existing methods often rely on forward-facing depth cameras, which create blind zones that restrict omnidirectional mobility. Furthermore, sparse post-contact unsafe stepping penalties lead to low learning efficiency and suboptimal strategies. To realize safe stair-traversal gaits, this paper introduces a single-stage training framework incorporating a dense unsafe stepping penalty that provides continuous feedback as the foot approaches a hazardous placement. To obtain stable and reliable elevation maps, we build a rolling point-cloud mapping system with spatiotemporal confidence decay and a self-protection zone mechanism, producing temporally consistent local maps. These maps are further refined by an Edge-Guided Asymmetric U-Net (EGAU), which mitigates reconstruction distortion caused by sparse LiDAR returns on stair risers. Simulation and real-robot experiments show that the proposed method achieves a near-100\% safe stepping rate on stair terrains in simulation, while maintaining a remarkably high safe stepping rate in real-world deployments. Furthermore, it completes a continuous long-distance walking test on complex outdoor terrains, demonstrating reliable sim-to-real transfer and long-term stability.