PA-MPPI: Perception-Aware Model Predictive Path Integral Control for Quadrotor Navigation in Unknown Environments

📄 arXiv: 2509.14978v1 📥 PDF

作者: Yifan Zhai, Rudolf Reiter, Davide Scaramuzza

分类: cs.RO

发布日期: 2025-09-18


💡 一句话要点

提出PA-MPPI,解决四旋翼在未知环境导航中探索不足的问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 四旋翼导航 模型预测控制 路径积分 未知环境 感知驱动 自主探索 机器人

📋 核心要点

  1. 传统MPPI在未知环境导航中,面对大型障碍物时,缺乏探索未知区域的能力,导致性能受限。
  2. PA-MPPI的核心在于引入感知代价,在线调整轨迹,引导四旋翼探索未知区域,扩展可通行空间。
  3. 硬件实验表明,PA-MPPI在复杂环境中显著优于传统MPPI,并可作为导航基础模型的安全策略。

📝 摘要(中文)

本文提出了一种感知驱动的模型预测路径积分控制(PA-MPPI)方法,用于解决四旋翼在未知环境中导航的问题。该问题面临三大挑战:障碍物导致的非凸自由空间、四旋翼的动力学约束和目标函数,以及探索未知区域以寻找通往目标的路径的需求。PA-MPPI通过引入感知代价,偏向于能够感知未知区域的轨迹,从而扩展已知的可通行空间,提高找到通往目标的替代路径的可能性。实验结果表明,PA-MPPI在具有挑战性的环境中,性能比基线方法提升高达100%。此外,PA-MPPI可以作为导航基础模型的安全且鲁棒的动作策略。

🔬 方法详解

问题定义:四旋翼在未知环境中导航,需要克服障碍物带来的非凸优化问题,同时满足四旋翼自身的动力学约束。传统MPPI方法虽然能较好地处理前两个问题,但在遇到大型障碍物遮挡目标时,缺乏主动探索未知区域的能力,容易陷入局部最优,导致导航失败。

核心思路:PA-MPPI的核心在于将“感知”融入到路径规划过程中。当目标被遮挡时,算法不再盲目地尝试绕过障碍物,而是主动探索障碍物后方的未知区域,以期发现新的可行路径。这种“感知驱动”的策略能够有效地扩展已知的可通行空间,提高找到全局最优路径的概率。

技术框架:PA-MPPI的整体框架仍然基于MPPI,但在代价函数中引入了感知代价。具体而言,算法首先利用传感器(如摄像头或激光雷达)获取环境信息,构建局部地图。然后,根据当前状态和目标位置,采样生成多条候选轨迹。对于每条轨迹,算法计算其总代价,包括运动学代价、动力学代价和感知代价。感知代价的设计使得能够观测到更多未知区域的轨迹具有更低的代价,从而更容易被选中。最后,算法选择代价最低的轨迹作为控制指令,驱动四旋翼运动。

关键创新:PA-MPPI最重要的创新在于引入了感知代价,将感知信息融入到路径规划过程中。与传统的MPPI方法相比,PA-MPPI不再仅仅依赖于已知的环境信息,而是能够主动地探索未知区域,从而更好地适应未知环境。这种感知驱动的策略使得四旋翼能够更有效地找到通往目标的路径,提高导航的成功率。

关键设计:感知代价的具体设计是PA-MPPI的关键。论文中,感知代价通常与轨迹能够观测到的未知区域的大小相关。例如,可以定义感知代价为轨迹末端传感器视野内未知区域的面积的负值。此外,为了保证轨迹的安全性,还需要考虑轨迹与已知障碍物之间的距离,避免碰撞。感知代价的具体形式可以根据具体的应用场景和传感器类型进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在具有挑战性的未知环境中,PA-MPPI的导航成功率比基线MPPI方法提升高达100%。PA-MPPI能够以50Hz的频率运行,并与高效的感知和建图模块集成。此外,实验还验证了PA-MPPI可以作为导航基础模型的安全动作策略,提高无人机在复杂环境中的鲁棒性。

🎯 应用场景

PA-MPPI在搜索救援、灾后评估、工业巡检等领域具有广泛的应用前景。在这些场景中,四旋翼需要在未知或部分未知的环境中自主导航,寻找目标或完成特定任务。PA-MPPI能够提高四旋翼在这些复杂环境中的导航能力,降低人工干预的需求,提高任务的效率和安全性。此外,该方法还可以作为导航基础模型的安全保障,确保无人机在复杂环境中的安全飞行。

📄 摘要(原文)

Quadrotor navigation in unknown environments is critical for practical missions such as search-and-rescue. Solving it requires addressing three key challenges: the non-convexity of free space due to obstacles, quadrotor-specific dynamics and objectives, and the need for exploration of unknown regions to find a path to the goal. Recently, the Model Predictive Path Integral (MPPI) method has emerged as a promising solution that solves the first two challenges. By leveraging sampling-based optimization, it can effectively handle non-convex free space while directly optimizing over the full quadrotor dynamics, enabling the inclusion of quadrotor-specific costs such as energy consumption. However, its performance in unknown environments is limited, as it lacks the ability to explore unknown regions when blocked by large obstacles. To solve this issue, we introduce Perception-Aware MPPI (PA-MPPI). Here, perception-awareness is defined as adapting the trajectory online based on perception objectives. Specifically, when the goal is occluded, PA-MPPI's perception cost biases trajectories that can perceive unknown regions. This expands the mapped traversable space and increases the likelihood of finding alternative paths to the goal. Through hardware experiments, we demonstrate that PA-MPPI, running at 50 Hz with our efficient perception and mapping module, performs up to 100% better than the baseline in our challenging settings where the state-of-the-art MPPI fails. In addition, we demonstrate that PA-MPPI can be used as a safe and robust action policy for navigation foundation models, which often provide goal poses that are not directly reachable.