AgniNav: Configuration-Driven Cross-Embodiment Local Planning for Robot Navigation
作者: Tianhao Zang, Siwei Cheng, Haidong Huang, Shanze Wang, Wei Zhang
分类: cs.RO
发布日期: 2026-06-09
💡 一句话要点
提出AgniNav以解决机器人导航中的跨体态迁移问题
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱七:动作重定向 (Motion Retargeting)
关键词: 单目导航 跨体态迁移 局部规划 机器人导航 碰撞检测 深度学习 安全包络
📋 核心要点
- 现有的视觉导航策略通常依赖于特定的机器人体态,导致跨平台迁移时需要重新训练或额外硬件支持。
- AgniNav通过定义可测量的四参数安全包络,标准化了不同机器人之间的局部导航迁移,避免了数据收集的复杂性。
- 在真实机器人实验中,AgniNav在不同平台上表现出色,成功率高且碰撞次数极少,验证了其有效性。
📝 摘要(中文)
单目局部导航对于轻量级机器人具有吸引力,但现有基于视觉的策略通常将感知与特定的机器人体态、相机高度和底盘耦合,使得从轮式平台到四足平台的迁移依赖于重新训练或主动深度硬件。本文提出AgniNav,一个配置驱动的局部导航框架,在碰撞包络层面标准化跨体态迁移。每个机器人由可测量的四参数安全包络指定:碰撞相关高度、前长、后长和半宽度。高度参数使得图像到扫描网络能够从单目彩色图像预测一维碰撞相关伪激光扫描,而其余底盘参数则配置了一个维度感知的局部规划器进行碰撞检测。训练使用基于高度条件的列最小扫描标签,从配对的彩色-深度数据生成,允许同一图像监督不同的安全包络,而无需收集特定于机器人的数据。AgniNav是首个在共享碰撞包络配置上联合条件感知和规划的单目局部导航框架,实现了在轮式、四足和人形平台上的零重训练部署。
🔬 方法详解
问题定义:本文旨在解决现有视觉导航方法在不同机器人体态间迁移时的依赖性问题,现有方法往往需要针对特定平台进行重新训练或使用额外的深度传感器。
核心思路:AgniNav框架通过定义一个四参数的安全包络,允许不同机器人共享感知和规划模块,从而实现跨体态的无缝迁移。该设计使得同一图像可以用于不同的机器人配置,降低了数据收集的复杂性。
技术框架:AgniNav的整体架构包括图像到伪激光扫描的网络和一个维度感知的局部规划器。首先,网络根据输入的单目图像生成碰撞相关的伪激光扫描,然后利用这些信息进行碰撞检测和路径规划。
关键创新:AgniNav的创新在于其首次实现了在共享碰撞包络配置上联合条件感知和规划,允许在不同机器人平台上进行零重训练的部署。这一方法显著提高了机器人在复杂环境中的导航能力。
关键设计:在训练过程中,使用高度条件的列最小扫描标签,这些标签是从配对的彩色和深度数据生成的。这种设计使得同一图像可以监督不同的安全包络,避免了特定于机器人的数据收集需求。
🖼️ 关键图片
📊 实验亮点
在真实机器人实验中,AgniNav在Turtlebot2、Unitree Go2和Accelerated Evolution K1平台上分别取得了39/40、18/20和18/20的成功率,碰撞次数分别为0/40、1/20和2/20,验证了其在不同平台上的高效性和安全性。
🎯 应用场景
AgniNav的研究成果在多种机器人平台的导航中具有广泛的应用潜力,特别是在需要快速部署和高效迁移的场景中,如服务机器人、救援机器人和自主移动设备等。其创新的跨体态迁移能力将推动机器人技术在复杂环境中的应用,提升机器人自主导航的灵活性和安全性。
📄 摘要(原文)
Monocular local navigation is attractive for lightweight robots, but existing vision-based policies often couple perception to a specific body, camera height, and footprint, making transfer from wheeled bases to legged platforms dependent on retraining or active depth hardware. This paper introduces AgniNav, a configuration-driven local navigation framework that standardizes cross-embodiment transfer at the collision-envelope level. Each robot is specified by a measurable four-parameter safety envelope: collision-relevant height, front length, rear length, and half width. The height parameter conditions an image-to-scan network to predict a one-dimensional, collision-relevant pseudo-laserscan from a monocular color image, while the remaining footprint parameters configure a dimension-aware local planner for collision checking. Training uses height-conditioned column-minimum scan labels generated from paired color-depth data, allowing the same image to supervise different safety envelopes without collecting robot-specific data. To the best of our knowledge, AgniNav is the first monocular local-navigation framework that jointly conditions perception and planning on a shared collision-envelope configuration for zero-retraining deployment across wheeled, quadruped, and humanoid platforms. Real-robot experiments on a Turtlebot2, Unitree Go2, and Accelerated Evolution K1 achieve 39/40, 18/20, and 18/20 successes with 0/40, 1/20, and 2/20 collisions, respectively, while running at 30 Hz on Jetson Orin.