osmAG-Nav: A Hierarchical Semantic Topometric Navigation Stack for Robust Lifelong Indoor Autonomy

📄 arXiv: 2603.28271v1 📥 PDF

作者: Yongqi Zhang, Jiajie Zhang, Chengqian Li, Fujing Xie, Sören Schwertfeger

分类: cs.RO

发布日期: 2026-03-30

备注: 42 pages, 10 figures


💡 一句话要点

提出osmAG-Nav,一种基于层级语义拓扑地图的室内自主导航系统,提升大规模环境下的导航鲁棒性。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 室内导航 机器人自主 拓扑地图 ROS2 激光雷达定位

📋 核心要点

  1. 传统导航系统依赖于单片占用栅格地图,面临存储效率、跨楼层推理和长程规划的瓶颈。
  2. osmAG-Nav基于层级语义拓扑osmAG地图,采用分层规划和滚动窗口机制,实现高效长程导航。
  3. 实验表明,在大型校园环境中,osmAG-Nav显著降低了规划延迟,并保持了定位稳定性。

📝 摘要(中文)

本文提出osmAG-Nav,一个完整的开源ROS2导航栈,它构建于层级语义拓扑OpenStreetMap Area Graph (osmAG)地图标准之上,旨在解决移动机器人在大型多楼层环境中部署时,传统导航系统在空间可扩展性、跨楼层推理和长程规划方面面临的瓶颈。该系统采用“系统集成”架构,将全局拓扑推理与局部度量执行解耦。层级osmAG规划器使用基于LCA锚定的通道中心图上的流水线代替了密集的栅格搜索,其边缘成本源于局部栅格可遍历性而非欧几里得距离,从而在校园规模的长路线上实现了低毫秒级的规划。滚动窗口机制在机器人周围栅格化固定大小的局部度量网格,使局部代价地图的内存占用独立于总映射区域,而分段执行策略将中间目标分派给标准的ROS2控制器,以实现平稳切换。结构感知的激光雷达定位框架通过永久架构先验过滤动态杂波,从而增强了系统的鲁棒性。在真实的多层室内外校园(>11,025平方米)上的大量实验表明,在同层基准子集上,osmAG-Nav在长路线上比基于栅格的基线降低了高达7816倍的规划延迟,同时保持了较低的路径长度开销和终身定位稳定性。单层远程机器人任务进一步验证了集成堆栈的可靠性。完整的堆栈以模块化的ROS2生命周期节点形式发布。

🔬 方法详解

问题定义:现有基于栅格地图的导航系统在大型、多楼层环境中面临可扩展性问题。具体来说,栅格地图的存储需求随环境面积线性增长,导致长程规划效率低下。此外,传统的栅格地图难以进行跨楼层推理和全局拓扑优化,限制了机器人的自主导航能力。现有方法难以兼顾全局规划效率和局部运动精度。

核心思路:osmAG-Nav的核心思路是将全局拓扑推理与局部度量执行解耦。通过构建层级语义拓扑地图(osmAG),系统可以在高层进行快速的全局路径规划,然后在局部使用滚动窗口机制维护一个固定大小的栅格地图,从而保证局部运动的精度和效率。这种分层结构使得系统能够在大规模环境中实现高效的导航。

技术框架:osmAG-Nav采用“系统集成”架构,包含以下主要模块:1) Hierarchical osmAG Planner:基于osmAG地图进行全局路径规划,使用LCA锚定的通道中心图,边缘成本基于局部栅格可遍历性。2) Rolling Window Mechanism:在机器人周围维护一个固定大小的局部栅格地图,用于局部路径规划和避障。3) Segmented Execution Strategy:将全局路径分解为一系列中间目标,并将其分派给标准的ROS2控制器执行。4) Structure-aware LiDAR Localization:利用环境的结构信息进行定位,过滤动态障碍物。

关键创新:osmAG-Nav的关键创新在于其层级语义拓扑地图表示和基于该地图的规划算法。与传统的栅格地图相比,osmAG地图更加紧凑,并且能够表示环境的语义信息,从而实现更高效的全局规划。此外,滚动窗口机制使得局部代价地图的内存占用独立于总映射区域,解决了大规模环境下的内存瓶颈。

关键设计:osmAG地图的构建依赖于OpenStreetMap数据和激光雷达扫描数据。边缘成本的计算基于局部栅格地图的可遍历性,而非欧几里得距离,从而更好地反映了实际的导航环境。滚动窗口的大小需要根据机器人的运动速度和环境的复杂程度进行调整。结构感知的激光雷达定位框架使用RANSAC算法来提取环境中的平面特征,并将其与预先构建的3D模型进行匹配。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在真实的多层室内外校园环境中进行的实验表明,osmAG-Nav在同层基准子集上,比基于栅格的基线降低了高达7816倍的规划延迟,同时保持了较低的路径长度开销和终身定位稳定性。单层远程机器人任务进一步验证了集成堆栈的可靠性。这些结果表明,osmAG-Nav在大型环境中具有显著的性能优势。

🎯 应用场景

osmAG-Nav适用于大型室内环境中的移动机器人导航,例如办公楼、商场、医院和校园。它可以用于机器人送货、安保巡逻、清洁服务和导览等任务。该系统能够提高机器人在复杂环境中的自主导航能力,降低人工干预的需求,并提升工作效率。未来,该技术有望应用于更广泛的机器人应用场景,例如智能家居和自动驾驶。

📄 摘要(原文)

The deployment of mobile robots in large-scale, multi-floor environments demands navigation systems that achieve spatial scalability without compromising local kinematic precision. Traditional navigation stacks, reliant on monolithic occupancy grid maps, face severe bottlenecks in storage efficiency, cross-floor reasoning, and long-horizon planning. To address these limitations, this paper presents osmAG-Nav, a complete, open-source ROS2 navigation stack built upon the hierarchical semantic topometric OpenStreetMap Area Graph (osmAG) map standard. The system follows a "System of Systems" architecture that decouples global topological reasoning from local metric execution. A Hierarchical osmAG planner replaces dense grid searches with an LCA-anchored pipeline on a passage-centric graph whose edge costs derive from local raster traversability rather than Euclidean distance, yielding low-millisecond planning on long campus-scale routes. A Rolling Window mechanism rasterizes a fixed-size local metric grid around the robot, keeping the local costmap memory footprint independent of the total mapped area, while a Segmented Execution strategy dispatches intermediate goals to standard ROS2 controllers for smooth handoffs. System robustness is reinforced by a structure-aware LiDAR localization framework that filters dynamic clutter against permanent architectural priors. Extensive experiments on a real-world multi-story indoor-outdoor campus (>11,025 m^2) show that, on the same-floor benchmark subset, osmAG-Nav delivers up to 7816x lower planning latency than a grid-based baseline on long routes while maintaining low path-length overhead and lifelong localization stability. A single-floor long-range robot mission further validates the integrated stack reliability. The full stack is released as modular ROS2 Lifecycle Nodes.