KIO-planner: Attention-Guided Single-Stage Motion Planning with Dual Mapping for UAV Navigation
作者: Dexing Yao, Haochen Li, Junhao Wei, Yifu Zhao, Yanxiao Li, Jiahui Xu, Jinxuan Hu, Lele Tian, Baili Lu, Zikun Li, Xu Yang, Sio-Kei Im, Dingcheng Yang, Yapeng Wang
分类: cs.RO
发布日期: 2026-05-19
备注: Accepted by an IEEE Vehicular Technology Conference. 6 pages, 4 figures, 1 table
💡 一句话要点
KIO-planner:基于注意力机制和双重映射的无人机单阶段运动规划
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 无人机导航 运动规划 深度学习 注意力机制 双重映射 自主飞行 碰撞避免
📋 核心要点
- 传统基于优化的规划器在密集结构障碍物中容易陷入局部最小值,且受限于建图延迟;现有的端到端学习方法难以提取精细的几何特征,缺乏硬性的运动学约束。
- KIO-planner通过集成CBAM关注关键结构边缘和可通行空间,并引入双重映射机制,在深度像素空间中实现运动可行性和无碰撞飞行,无需全局地图融合。
- 实验表明,KIO-planner能够实现高达3.0 m/s的敏捷导航,推理延迟低至24ms,轨迹更平滑,控制成本降低28.4%,最小障碍物距离显著提升至0.76m。
📝 摘要(中文)
本文提出了一种名为KIO-planner的、基于注意力机制的单阶段轨迹规划框架,旨在解决无人机在受限、墙壁密集的环境中自主飞行时,对低延迟和可靠运动规划的需求。该方法集成了卷积块注意力模块(CBAM),自适应地关注关键结构边缘和可通行空间。此外,引入了一种新颖的双重映射机制,包含物理边界激活和深度像素空间中的确定性几何安全盾,以在没有全局地图融合的情况下,强制执行运动可行性和无碰撞飞行。实验结果表明,KIO-planner能够实现高达3.0 m/s的高速敏捷导航,推理延迟约为24ms,轨迹更平滑,控制成本降低28.4%,且最小障碍物距离从0.48m提升至0.76m,确保了在高度约束环境中的快速、平滑和更安全的导航。
🔬 方法详解
问题定义:无人机在狭窄、墙壁密集的复杂环境中自主导航,需要低延迟、高可靠性的运动规划。传统优化方法计算复杂度高,易陷入局部最优解,且依赖精确的地图信息。现有的端到端学习方法难以从原始深度图像中提取精细的几何特征,并且缺乏对无人机运动学约束的显式建模,导致碰撞风险增加。
核心思路:KIO-planner的核心在于利用注意力机制增强感知能力,并设计双重映射机制来保证运动规划的安全性和可行性。通过注意力机制,网络能够更有效地提取环境中的关键几何信息,减少对全局地图的依赖。双重映射机制则在像素空间直接施加物理约束和几何安全约束,避免了复杂的全局地图融合和碰撞检测过程。
技术框架:KIO-planner采用单阶段的端到端学习框架,主要包含以下模块:1) 感知模块:使用深度图像作为输入,通过卷积神经网络提取特征,并集成CBAM注意力模块,增强对关键结构边缘的感知能力。2) 规划模块:基于提取的特征,生成无人机的轨迹。3) 双重映射模块:包含物理边界激活和几何安全盾,用于约束生成的轨迹,保证运动可行性和无碰撞。
关键创新:该论文的关键创新在于以下两点:1) 将CBAM注意力机制引入无人机运动规划,使网络能够自适应地关注环境中的关键几何信息,提高感知精度。2) 提出了双重映射机制,通过物理边界激活和几何安全盾,在像素空间直接施加运动学约束和碰撞避免约束,无需全局地图融合,降低了计算复杂度,提高了规划速度和安全性。
关键设计:CBAM模块被集成到感知网络的卷积层之间,自适应地学习通道和空间注意力权重。物理边界激活通过激活函数限制无人机的运动范围。几何安全盾则在深度图像的像素空间定义一个安全区域,确保生成的轨迹与障碍物保持一定的距离。损失函数包括轨迹平滑损失、控制成本损失和碰撞惩罚项,用于优化生成的轨迹。
🖼️ 关键图片
📊 实验亮点
实验结果表明,KIO-planner在高速导航(3.0 m/s)下表现出色,推理延迟仅为24ms,显著低于现有方法。与最先进的基线方法相比,KIO-planner生成的轨迹更加平滑,控制成本降低了28.4%。更重要的是,KIO-planner显著提高了安全性,将最小障碍物距离从0.48m提升至0.76m,有效避免了碰撞风险。
🎯 应用场景
KIO-planner适用于各种需要在狭窄、复杂环境中进行自主导航的无人机应用,例如室内巡检、仓库物流、灾难救援等。该方法能够提高无人机在这些场景下的导航效率和安全性,降低人工干预的需求,具有重要的实际应用价值。未来,该方法可以扩展到其他类型的机器人,并与其他感知和控制技术相结合,实现更高级别的自主导航能力。
📄 摘要(原文)
Autonomous UAV flight in confined, wall-dense environments requires low-latency and reliable motion planning under strict safety constraints. Traditional optimization-based planners suffer from mapping latency and easily fall into local minima when navigating through dense structural obstacles. Meanwhile, existing end-to-end learning methods struggle to extract fine-grained geometric features from raw depth images and lack hard kinodynamic constraints, leading to unpredictable collisions near walls. To address these issues, we propose KIO-planner, an attention-guided single-stage trajectory planning framework. First, we integrate a Convolutional Block Attention Module (CBAM) into the perception backbone to adaptively focus on critical structural edges and traversable space. Second, we introduce a novel Dual Mapping mechanism--comprising physical bounds activation and a deterministic Geometric Safety Shield in the depth-pixel space--to enforce kinodynamic feasibility and collision-free flight without global map fusion. Extensive high-fidelity simulated experiments demonstrate that KIO-planner enables highly agile navigation at speeds up to 3.0 m/s. Compared to the state-of-the-art baseline, KIO-planner achieves lower inference latency (approximately 24 ms) and generates significantly smoother trajectories, reducing control cost by 28.4%. Most notably, our Dual Mapping substantially increases the worst-case safety margin, measured by minimum distance to obstacles, from 0.48 m to 0.76 m, ensuring fast, smooth, and safer navigation in highly constrained environments.