ADAPT: Adaptive Dual-projection Architecture for Perceptive Traversal

📄 arXiv: 2603.16328v1 📥 PDF

作者: Shuo Shao, Tianchen Huang, Wei Gao, Shiwu Zhang

分类: cs.RO

发布日期: 2026-03-17


💡 一句话要点

提出ADAPT,通过自适应双投影架构实现复杂3D环境中的高效拟人运动

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 人形机器人 强化学习 自适应感知 三维环境 运动规划

📋 核心要点

  1. 现有方法在复杂3D环境中进行拟人运动时,感知范围固定,难以兼顾感知精度和计算效率。
  2. ADAPT通过可学习的感知范围,自适应调整水平高度图和垂直距离图的分辨率,优化感知策略。
  3. 实验表明,ADAPT在Unitree G1人形机器人上实现了零样本迁移,并显著优于固定范围的基线方法。

📝 摘要(中文)

在复杂的3D环境中,敏捷的拟人运动需要在感知保真度和计算效率之间取得平衡,但现有方法通常依赖于固定的感知配置。我们提出了ADAPT(用于感知遍历的自适应双投影架构),它使用水平高度图表示地形几何结构,使用垂直距离图表示可通行空间约束。ADAPT进一步将空间感知范围视为可学习的动作,使策略能够在快速运动期间扩大其感知范围,并在杂乱场景中缩小感知范围以获得更精细的局部分辨率。与基于体素的基线相比,ADAPT大大降低了观察维度和计算开销,同时显著加速了训练。实验表明,它成功地零样本迁移到Unitree G1人形机器人,并且显著优于固定范围的基线,从而在各种3D环境挑战中实现了高度鲁棒的遍历。

🔬 方法详解

问题定义:论文旨在解决人形机器人在复杂3D环境中进行高效、鲁棒运动的问题。现有方法通常采用固定的感知范围,无法根据环境的复杂程度和运动状态动态调整感知策略,导致在计算资源有限的情况下,难以同时保证感知精度和计算效率。例如,在开阔地带需要更大的感知范围以规划长距离路径,而在狭窄或障碍物密集的区域则需要更高的局部感知分辨率。

核心思路:ADAPT的核心思路是将机器人的空间感知范围视为一个可学习的动作,通过强化学习训练策略,使机器人能够根据当前的环境和运动状态自适应地调整感知范围。这种自适应性允许机器人在快速运动时扩大感知范围以进行全局规划,并在复杂环境中缩小感知范围以进行精细的局部避障。

技术框架:ADAPT的整体架构包含以下几个主要模块:1) 环境表示模块:使用水平高度图(elevation map)表示地形几何结构,使用垂直距离图(distance map)表示可通行空间约束。2) 感知范围选择模块:通过一个神经网络学习选择合适的感知范围,该范围决定了高度图和距离图的分辨率。3) 运动控制模块:根据环境表示和选择的感知范围,生成运动控制指令,驱动机器人运动。4) 强化学习训练模块:使用强化学习算法训练感知范围选择模块和运动控制模块,以最大化机器人的运动效率和鲁棒性。

关键创新:ADAPT最重要的技术创新点在于将空间感知范围视为一个可学习的动作。与现有方法中固定的感知范围不同,ADAPT能够根据环境和运动状态动态调整感知范围,从而在计算资源有限的情况下,实现更高的感知效率和运动性能。此外,双投影架构(水平高度图和垂直距离图)能够更有效地表示3D环境,降低了观察维度和计算开销。

关键设计:ADAPT的关键设计包括:1) 使用深度卷积神经网络(CNN)学习感知范围选择策略。2) 使用强化学习算法(如PPO)训练感知范围选择模块和运动控制模块。3) 设计奖励函数,鼓励机器人快速、鲁棒地运动,同时避免碰撞。4) 对高度图和距离图进行归一化处理,以提高训练的稳定性和收敛速度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ADAPT在Unitree G1人形机器人上进行了实验验证,结果表明,ADAPT能够成功地零样本迁移到真实机器人,并且显著优于固定范围的基线方法。具体而言,ADAPT在各种3D环境挑战中实现了更高的遍历成功率和更快的运动速度,证明了其在复杂环境中具有高度的鲁棒性和适应性。与基于体素的基线相比,ADAPT大大降低了观察维度和计算开销,同时显著加速了训练。

🎯 应用场景

ADAPT技术可广泛应用于人形机器人在复杂环境中的导航、搜索救援、工业巡检等领域。通过自适应调整感知范围,机器人能够在资源受限的情况下,更高效、更安全地完成任务。该研究成果对于提升人形机器人的自主性和适应性具有重要意义,并有望推动人形机器人在实际场景中的应用。

📄 摘要(原文)

Agile humanoid locomotion in complex 3D en- vironments requires balancing perceptual fidelity with com- putational efficiency, yet existing methods typically rely on rigid sensing configurations. We propose ADAPT (Adaptive dual-projection architecture for perceptive traversal), which represents the environment using a horizontal elevation map for terrain geometry and a vertical distance map for traversable- space constraints. ADAPT further treats its spatial sensing range as a learnable action, enabling the policy to expand its perceptual horizon during fast motion and contract it in cluttered scenes for finer local resolution. Compared with voxel-based baselines, ADAPT drastically reduces observation dimensionality and computational overhead while substantially accelerating training. Experimentally, it achieves successful zero-shot transfer to a Unitree G1 Humanoid and signifi- cantly outperforms fixed-range baselines, yielding highly robust traversal across diverse 3D environtmental challenges.