NavMoE: Hybrid Model- and Learning-based Traversability Estimation for Local Navigation via Mixture of Experts
作者: Botao He, Amir Hossein Shahidzadeh, Yu Chen, Jiayi Wu, Tianrui Guan, Guofei Chen, Howie Choset, Dinesh Manocha, Glen Chou, Cornelia Fermuller, Yiannis Aloimonos
分类: cs.RO
发布日期: 2025-09-16 (更新: 2025-09-17)
💡 一句话要点
提出NavMoE,通过混合专家模型实现机器人局部导航中更高效、泛化的地形可通行性估计。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 可通行性估计 机器人导航 混合专家模型 惰性门控 跨域泛化
📋 核心要点
- 现有可通行性估计方法难以在保证可靠性和鲁棒性的同时,有效地编码几何和语义信息,从而限制了其在复杂环境下的应用。
- NavMoE 采用混合专家模型,针对不同地形类型选择合适的模型(模型驱动或学习驱动),并通过门控网络动态调整各模型的权重。
- 实验结果表明,NavMoE 在跨域泛化能力和计算效率方面优于单一专家模型或完整集成模型,计算成本降低了 81.2%。
📝 摘要(中文)
本文探讨了机器人导航中的可通行性估计问题。可通行性估计的关键瓶颈在于如何在不同环境中高效地实现可靠且鲁棒的预测,同时准确地编码几何和语义信息。我们提出了一种名为Navigation via Mixture of Experts (NAVMOE) 的分层模块化方法,用于可通行性估计和局部导航。NAVMOE 结合了多个针对特定地形类型的专家模型,每个模型可以是经典的模型驱动方法或学习驱动方法,用于预测特定地形类型的可通行性。NAVMOE 通过门控网络,根据输入环境动态地加权不同模型的贡献。总的来说,我们的方法提供了三个优势:首先,NAVMOE 能够自适应地利用针对不同地形的专门方法进行可通行性估计,从而增强了在不同和未见环境中的泛化能力。其次,通过引入一种免训练的惰性门控机制,我们的方法在解决方案质量损失可忽略不计的情况下显著提高了效率,该机制旨在最大限度地减少推理过程中激活的专家数量。第三,我们的方法使用两阶段训练策略,可以在包含不可微模块的混合 MoE 方法中训练门控网络。大量实验表明,NAVMOE 在不同领域中提供了比任何单个专家或完整集成更好的效率和性能平衡,通过惰性门控将平均计算成本降低了 81.2%,而路径质量的损失不到 2%。
🔬 方法详解
问题定义:论文旨在解决机器人局部导航中可通行性估计的问题。现有方法难以兼顾效率、鲁棒性和泛化性,尤其是在面对复杂多变的环境时,难以准确评估不同地形的可通行程度。现有方法要么依赖于特定环境的先验知识,要么计算复杂度高,难以满足实时性要求。
核心思路:论文的核心思路是利用混合专家模型(Mixture of Experts, MoE),将不同的可通行性估计模型(专家)针对性地应用于不同的地形类型。通过门控网络动态地选择和加权这些专家,从而实现自适应的可通行性估计。这种方法能够结合模型驱动和数据驱动方法的优点,提高泛化能力和效率。
技术框架:NavMoE 的整体框架包含以下几个主要模块:1) 多个专家模型,每个模型负责特定地形的可通行性估计,可以是传统的模型驱动方法或基于深度学习的方法;2) 门控网络,根据输入环境的特征,动态地计算每个专家的权重;3) 惰性门控机制,用于减少推理过程中激活的专家数量,提高计算效率;4) 两阶段训练策略,用于训练包含不可微模块的混合 MoE 模型。
关键创新:NavMoE 的关键创新在于:1) 混合专家模型的设计,能够针对不同地形选择合适的专家,提高泛化能力;2) 惰性门控机制,能够在保证性能的同时显著降低计算成本;3) 两阶段训练策略,解决了混合 MoE 模型中不可微模块的训练问题。与现有方法的本质区别在于,NavMoE 能够自适应地选择和组合不同的可通行性估计方法,而不是依赖于单一的方法。
关键设计:惰性门控机制通过设定阈值来决定是否激活某个专家,只有当门控网络的输出值大于阈值时,该专家才会被激活。两阶段训练策略首先训练专家模型,然后固定专家模型的参数,训练门控网络。损失函数的设计需要考虑可通行性估计的准确性和计算效率,例如可以采用交叉熵损失函数来衡量可通行性估计的准确性,并引入正则化项来约束激活的专家数量。
🖼️ 关键图片
📊 实验亮点
实验结果表明,NavMoE 在多个数据集上都取得了优于单一专家模型和完整集成模型的效果。通过惰性门控机制,NavMoE 将平均计算成本降低了 81.2%,而路径质量的损失不到 2%。此外,NavMoE 在跨域泛化能力方面也表现出色,能够在未见过的环境中实现可靠的可通行性估计。
🎯 应用场景
NavMoE 可应用于各种机器人导航场景,例如自动驾驶、无人机巡检、移动机器人等。该方法能够提高机器人在复杂环境中的导航能力,使其能够更安全、更高效地完成任务。此外,NavMoE 还可以应用于虚拟现实和增强现实等领域,为用户提供更逼真的环境交互体验。
📄 摘要(原文)
This paper explores traversability estimation for robot navigation. A key bottleneck in traversability estimation lies in efficiently achieving reliable and robust predictions while accurately encoding both geometric and semantic information across diverse environments. We introduce Navigation via Mixture of Experts (NAVMOE), a hierarchical and modular approach for traversability estimation and local navigation. NAVMOE combines multiple specialized models for specific terrain types, each of which can be either a classical model-based or a learning-based approach that predicts traversability for specific terrain types. NAVMOE dynamically weights the contributions of different models based on the input environment through a gating network. Overall, our approach offers three advantages: First, NAVMOE enables traversability estimation to adaptively leverage specialized approaches for different terrains, which enhances generalization across diverse and unseen environments. Second, our approach significantly improves efficiency with negligible cost of solution quality by introducing a training-free lazy gating mechanism, which is designed to minimize the number of activated experts during inference. Third, our approach uses a two-stage training strategy that enables the training for the gating networks within the hybrid MoE method that contains nondifferentiable modules. Extensive experiments show that NAVMOE delivers a better efficiency and performance balance than any individual expert or full ensemble across different domains, improving cross-domain generalization and reducing average computational cost by 81.2% via lazy gating, with less than a 2% loss in path quality.