Egocentric Tactile and Proximity Sensors as Observation Priors for Humanoid Collision Avoidance

📄 arXiv: 2604.25554v1 📥 PDF

作者: Carson Kohlbrenner, Niraj Pudasaini, William Xie, Naren Sivagnanadasan, Nikolaus Correll, Alessandro Roncone

分类: cs.RO, cs.LG

发布日期: 2026-04-28

备注: This work was accepted at the 8th RoboTac Workshop at the International Conference on Robotics and Automation (ICRA) 2026


💡 一句话要点

利用触觉和近邻觉信息,提升人型机器人避障能力

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture) 支柱六:视频提取与匹配 (Video Extraction)

关键词: 人型机器人 碰撞避免 强化学习 触觉传感器 近邻觉传感器

📋 核心要点

  1. 机器人避障通常依赖触觉和近邻觉传感器,但如何优化这些传感器的属性(如覆盖范围、类型和范围)以实现有效的避障行为仍不明确。
  2. 本文提出了一种强化学习框架,用于学习人型机器人的全身避障策略,并重点研究不同传感器属性对学习效果的影响。
  3. 实验结果表明,适当范围的近邻觉传感器可以替代显式的物体定位,并且稀疏的非定向传感器在样本效率上优于密集的方向性传感器。

📝 摘要(中文)

本文提出了一种基于强化学习的框架,用于人型机器人H1-2的全身避障,并利用该框架来研究传感器属性如何影响学习到的避障行为。通过以躲避球为基准任务,对分布在机器人上半身的传感器的属性进行消融实验,发现只要传感范围足够,原始的近邻觉测量可以替代显式的物体定位。此外,在样本效率方面,稀疏的非定向近邻觉信号优于密集的方向性替代方案。

🔬 方法详解

问题定义:论文旨在解决人型机器人在复杂环境中进行全身避障的问题。现有的方法可能依赖外部摄像头,但容易受到遮挡的影响。此外,如何选择和配置机器人自身的触觉和近邻觉传感器,以实现高效的避障,也是一个挑战。

核心思路:论文的核心思路是利用强化学习,让人型机器人通过与环境的交互,自主学习避障策略。通过对不同传感器属性进行消融实验,分析各种传感器配置对学习效果的影响,从而找到最优的传感器配置方案。

技术框架:整体框架包括以下几个主要部分:1)人型机器人H1-2的物理仿真环境;2)分布在机器人上半身的触觉和近邻觉传感器;3)基于强化学习的控制策略学习算法;4)躲避球基准任务,用于评估避障策略的性能。机器人通过传感器获取环境信息,然后利用强化学习算法学习控制策略,最终实现躲避球的目标。

关键创新:论文的关键创新在于系统性地研究了不同传感器属性对人型机器人避障性能的影响。通过消融实验,揭示了原始近邻觉测量在一定条件下可以替代显式物体定位,以及稀疏非定向传感器在样本效率方面的优势。这为机器人传感器的选择和配置提供了重要的指导。

关键设计:论文中,强化学习算法的具体选择未知,但关键设计在于对传感器属性的消融实验。例如,改变传感器的范围、方向性、密度等,然后观察这些改变对学习到的避障策略性能的影响。此外,躲避球任务的设计也至关重要,它需要能够有效地评估机器人的避障能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在躲避球任务中,具有足够传感范围的原始近邻觉测量可以替代显式的物体定位。更重要的是,稀疏的非定向近邻觉信号在样本效率上优于密集的方向性替代方案,这意味着在资源有限的情况下,选择合适的传感器类型和配置可以显著提高学习效率。

🎯 应用场景

该研究成果可应用于各种人型机器人应用场景,例如:在拥挤环境中导航、在复杂地形中行走、与人类进行安全交互等。通过优化机器人自身的传感器配置,可以提高机器人的自主性和安全性,使其能够更好地适应各种实际应用环境。

📄 摘要(原文)

Collision-free motion is often aided by tactile and proximity sensors distributed on the body of the robot due to their resistance to occlusion as opposed to external cameras. However, how to shape the sensor's properties, such as sensing coverage; type; and range, to enable avoidant behavior remains unclear. In this work, we present a reinforcement learning framework for whole-body collision avoidance on a humanoid H1-2 robot and use it to characterize how sensor properties shape learned avoidance behavior. Using dodgeball as a benchmark task, we ablate the properties of sensors distributed across the upper body of the robot and find that raw proximity measurements can substitute for explicit object localization provided the sensing range is sufficient and that sparse non-directional proximity signals outpace dense directional alternatives in sample efficiency.