GUIDE: Goal-Initialized Directional Understanding for End-to-End Visual Navigation

📄 arXiv: 2606.10832v1 📥 PDF

作者: Liang Wang, Jin Jin, KanZhong Yao, YiBin Wu, Fangqiang Ding, Jin Wang, Jun Wu, Zhe Sun, Qiuguo Zhu

分类: cs.RO

发布日期: 2026-06-09

备注: https://guide-navigation.github.io/


💡 一句话要点

提出GUIDE框架以解决腿部机器人导航中的目标更新问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: 视觉导航 腿部机器人 强化学习 空间记忆 自我运动 环境感知 端到端系统

📋 核心要点

  1. 现有的视觉导航方法依赖于持续的目标更新,导致额外的计算和传感器负担,限制了移动自主性。
  2. 本文提出了GUIDE框架,通过一次性目标初始化,培养机器人内在的空间记忆和方向意识。
  3. 实验表明,GUIDE在模拟和真实场景中均能有效学习自我运动和方向意识,提升了导航能力。

📝 摘要(中文)

基于学习的视觉导航通常依赖于来自层次状态估计的持续目标更新,这导致额外的传感器和计算开销,并偏离完全端到端的移动自主性。为了解决这些问题,本文提出了一种目标初始化导航设置,机器人在每个任务开始时仅接收一次目标,依靠内在空间记忆进行导航。我们提出的GUIDE框架是一个完全端到端的强化学习框架,旨在培养内部方向意识。GUIDE结合了空间锚点预测器和原始深度流,以提取自我运动表示并感知局部环境几何。实验结果表明,GUIDE能够在没有后续目标指导或先前地图的情况下,安全地在复杂环境中导航。

🔬 方法详解

问题定义:本文旨在解决腿部机器人在视觉导航中对持续目标更新的依赖问题。现有方法在部分可观测环境中容易导致短视行为,限制了导航的灵活性和效率。

核心思路:GUIDE框架通过一次性目标初始化,促使机器人依靠内在空间记忆进行导航,避免了对外部目标更新的依赖,从而实现完全的端到端自主导航。

技术框架:GUIDE框架包括空间锚点预测器和原始深度流处理模块。空间锚点预测器利用多频率的自我运动历史提取自我运动表示,而深度流模块则用于感知局部环境几何。

关键创新:GUIDE的主要创新在于其完全端到端的设计,机器人能够在没有后续目标指导的情况下,依靠内在的空间记忆进行导航。这与传统方法的依赖性形成鲜明对比。

关键设计:在设计中,GUIDE使用了特定的损失函数来优化空间锚点预测器的性能,并通过深度学习网络结构来处理多模态输入,确保机器人能够有效地理解和适应复杂环境。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,GUIDE框架在模拟和真实场景中均表现出色,能够在复杂环境中安全导航,成功避免了死胡同和复杂结构布局。与基线方法相比,GUIDE在导航效率和安全性上有显著提升,展示了其在实际应用中的潜力。

🎯 应用场景

该研究的潜在应用领域包括自主机器人导航、智能家居、仓储物流等。通过提升机器人在复杂环境中的导航能力,GUIDE框架有望在未来的智能机器人系统中发挥重要作用,推动移动自主技术的发展。

📄 摘要(原文)

Learning-based visual navigation for legged robots typically relies on continuous goal updates from hierarchical state estimation to provide a persistent directional reference. This reliance incurs additional sensory and computational overhead and deviates from fully end-to-end mobile autonomy. Furthermore, under partial observability, policies are prone to learn myopic behaviors, easily becoming trapped in dead ends and complex structural layouts. To address these limitations, we investigate a goal-initialized navigation setting, where the target is provided only once at the beginning of an episode, requiring the robot to operate based on intrinsic spatial memory without subsequent goal updates from external modules. In this work, we propose GUIDE, a fully end-to-end reinforcement learning framework designed to cultivate internal directional awareness. Specifically, GUIDE incorporates a spatial anchor predictor that leverages multi-frequency proprioceptive history to extract egomotion representations, thereby maintaining a persistent long-horizon spatial context for navigation. Concurrently, it utilizes raw depth streams to perceive local environmental geometry. We evaluate the proposed framework across both simulation and real-world scenarios on a quadruped robot. Experiments show that GUIDE learns reliable egomotion and directional awareness, enabling a fully end-to-end deployed policy to safely navigate through dense clutter and structured mazes without subsequent goal guidance or prior maps.