GustPilot: A Hierarchical DRL-INDI Framework for Wind-Resilient Quadrotor Navigation

作者: Amir Atef Habel, Roohan Ahmed Khan, Fawad Mehboob, Clement Fortin, Dzmitry Tsetserukou

分类: cs.RO

发布日期: 2026-03-20

备注: 8 pages, 5 figures

💡 一句话要点

GustPilot：一种用于抗风四旋翼导航的分层DRL-INDI框架

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱二：RL算法与架构 (RL & Architecture)

关键词: 四旋翼 抗风导航 深度强化学习 增量非线性动态逆 分层控制 域随机化 无人机

📋 核心要点

轻型四旋翼在风扰动下难以实现可靠自主导航，现有方法在规划和跟踪方面存在不足，容易受到气流影响。
GustPilot采用分层结构，利用DRL生成速度参考，并结合INDI控制器进行低级跟踪和快速扰动抑制，实现抗风导航。
实验表明，GustPilot在复杂风场环境中显著优于DRL-PID基线，成功率大幅提升，跟踪误差降低，并能维持较高飞行速度。

📝 摘要（中文）

风扰动仍然是轻型四旋翼可靠自主导航的关键障碍，快速变化的气流会破坏规划和跟踪的稳定性。本文介绍了一种分层抗风导航堆栈GustPilot，其中深度强化学习（DRL）策略生成惯性系速度参考，用于穿越门。同时，几何增量非线性动态逆（INDI）控制器提供低级跟踪，具有快速的残余扰动抑制能力。INDI层通过提供特定线加速度和角加速度率的增量反馈来实现这一点，使用板载传感器测量来快速抑制风扰动。通过双层策略获得鲁棒性：通过训练期间的风扇射流域随机化学习的风感知规划，以及通过INDI跟踪控制器实现的快速执行时扰动抑制。我们在50克四旋翼平台上，针对DRL-PID基线，在从无风到完全动态条件（包括移动门和移动扰动源）的四种场景中评估了GustPilot的性能。尽管仅在最小的单门和单风扇设置中进行训练，该策略仍可推广到更复杂的环境（最多六个门和四个风扇），而无需重新训练。在80次实验中，DRL-INDI的平均总体成功率（OSR）为94.7%，而DRL-PID为55.0%，跟踪RMSE降低高达50%，并且在高达3.5 m/s的风扰动下保持高达1.34 m/s的速度。这些结果表明，将基于DRL的速度规划与结构化的INDI扰动抑制相结合，为抗风自主飞行导航提供了一种实用且可推广的方法。

🔬 方法详解

问题定义：论文旨在解决轻型四旋翼在复杂风场环境中难以实现稳定自主导航的问题。现有方法，如PID控制，在面对快速变化的风扰动时，难以保证飞行器的稳定性和轨迹跟踪精度。传统的基于模型的控制方法需要精确的风场模型，而实际应用中难以获取准确的风场信息。因此，需要一种能够适应未知风扰动并实现鲁棒导航的控制策略。

核心思路：论文的核心思路是将深度强化学习（DRL）与增量非线性动态逆（INDI）控制相结合，构建一个分层的控制框架。DRL负责生成全局的速度参考，INDI控制器负责低层次的轨迹跟踪和扰动抑制。DRL通过在模拟环境中进行大量训练，学习到适应风扰动的飞行策略。INDI控制器利用飞行器自身的传感器信息，实时估计和补偿风扰动，从而提高控制的鲁棒性。

技术框架：GustPilot框架包含两个主要模块：DRL速度规划器和INDI跟踪控制器。DRL速度规划器基于深度神经网络，输入是环境状态（例如，门的位置和风场信息），输出是期望的速度参考。该速度参考被传递给INDI跟踪控制器。INDI跟踪控制器利用飞行器的加速度计和陀螺仪数据，估计风扰动对飞行器的影响，并计算出相应的控制力矩和推力，以抵消风扰动，实现对期望轨迹的精确跟踪。

关键创新：论文的关键创新在于将DRL和INDI控制相结合，实现了一种鲁棒的抗风导航策略。DRL负责学习全局的飞行策略，INDI负责快速抑制局部扰动。这种分层结构充分利用了DRL的自适应能力和INDI的快速响应能力。此外，论文还采用了风扇射流域随机化技术，提高了DRL策略在真实环境中的泛化能力。

关键设计：DRL速度规划器使用Actor-Critic网络结构，Actor网络输出期望的速度参考，Critic网络评估当前状态的价值。奖励函数的设计考虑了飞行器的速度、与目标的距离以及控制的平滑性。INDI跟踪控制器使用几何控制方法，将飞行器的姿态和位置误差转化为控制力矩和推力。关键参数包括DRL网络的学习率、折扣因子以及INDI控制器的增益。

🖼️ 关键图片

📊 实验亮点

实验结果表明，GustPilot在抗风性能方面显著优于DRL-PID基线。在包含移动门和移动风源的复杂环境中，GustPilot的平均总体成功率（OSR）达到94.7%，而DRL-PID仅为55.0%。此外，GustPilot的跟踪RMSE降低高达50%，并且在高达3.5 m/s的风扰动下能够维持高达1.34 m/s的速度。这些数据充分证明了GustPilot在抗风导航方面的优越性能。

🎯 应用场景

该研究成果可应用于无人机物流、环境监测、农业植保等领域，尤其是在风力较大的环境中。例如，在沿海地区进行桥梁检测，或在山区进行电力巡检等任务。该方法能够提高无人机在复杂环境中的稳定性和可靠性，降低操作风险，提高工作效率，具有重要的实际应用价值和广阔的应用前景。

📄 摘要（原文）

Wind disturbances remain a key barrier to reliable autonomous navigation for lightweight quadrotors, where the rapidly varying airflow can destabilize both planning and tracking. This paper introduces GustPilot, a hierarchical wind-resilient navigation stack in which a deep reinforcement learning (DRL) policy generates inertial-frame velocity reference for gate traversal. At the same time, a geometric Incremental Nonlinear Dynamic Inversion (INDI) controller provides low-level tracking with fast residual disturbance rejection. The INDI layer achieves this by providing incremental feedback on both specific linear acceleration and angular acceleration rate, using onboard sensor measurements to reject wind disturbances rapidly. Robustness is obtained through a two-level strategy, wind-aware planning learned via fan-jet domain randomization during training, and rapid execution-time disturbance rejection by the INDI tracking controller. We evaluate GustPilot in real flights on a 50g quad-copter platform against a DRL-PID baseline across four scenarios ranging from no-wind to fully dynamic conditions with a moving gate and a moving disturbance source. Despite being trained only in a minimal single-gate and single-fan setup, the policy generalizes to significantly more complex environments (up to six gates and four fans) without retraining. Across 80 experiments, DRL-INDI achieves a 94.7% versus 55.0% for DRL-PID as average Overall Success Rate (OSR), reduces tracking RMSE up to 50%, and sustains speeds up to 1.34 m/s under wind disturbances up to 3.5 m/s. These results demonstrate that combining DRL-based velocity planning with structured INDI disturbance rejection provides a practical and generalizable approach to wind-resilient autonomous flight navigation.

GustPilot: A Hierarchical DRL-INDI Framework for Wind-Resilient Quadrotor Navigation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理