High-lift Wing Separation Control via Bayesian Optimization and Deep Reinforcement Learning

📄 arXiv: 2605.11981v1 📥 PDF

作者: Ricard Montalà, Bernat Font, Oriol Lehmkuhl, Ricardo Vinuesa, Ivette Rodriguez

分类: physics.flu-dyn, cs.AI

发布日期: 2026-05-12


💡 一句话要点

通过贝叶斯优化和深度强化学习实现高升力翼分离控制

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 高升力翼 主动流动控制 贝叶斯优化 深度强化学习 气动效率 流动模拟 失速控制

📋 核心要点

  1. 现有的流动控制方法在高雷诺数下面临失速和气动效率提升的挑战。
  2. 本研究提出了结合贝叶斯优化和深度强化学习的主动流动控制策略,以优化高升力翼的气动性能。
  3. 实验结果显示,贝叶斯优化显著提高了气动效率,而深度强化学习的改进效果有限,强调了奖励设计的重要性。

📝 摘要(中文)

本研究探讨了在雷诺数Re$_c$ = 450,000和攻角$α$ = 23$^ ext{°}$下,利用壁面解析的大涡模拟(LES)对30P30N高升力翼进行主动流动控制(AFC)。研究采用了两种优化策略:开放式贝叶斯优化(BO)和闭环深度强化学习(DRL),旨在通过在襟翼、主翼和副翼上施加合成喷流来减轻失速并提高气动效率。未控制配置的验证与文献数据一致,确认了LES设置的可靠性。BO框架成功识别出稳态喷流速度,使效率提高了10.9%,同时减少了9.7%的阻力并保持升力。相比之下,尽管DRL代理利用了来自分布式传感器的瞬时流动信息,但在升力和阻力方面仅实现了微小改善,效率提升微乎其微。训练分析表明,惩罚主导的奖励限制了探索。这些结果强调了在高雷诺数下,DRL基础流动控制中需要精心设计的奖励和计算加速策略。

🔬 方法详解

问题定义:本研究旨在解决高升力翼在高雷诺数下的流动控制问题,现有方法在失速和气动效率提升方面存在不足。

核心思路:通过结合贝叶斯优化和深度强化学习,探索主动流动控制的有效策略,以提高高升力翼的气动性能。

技术框架:研究采用壁面解析的大涡模拟(LES)进行流动分析,分别实现开放式贝叶斯优化和闭环深度强化学习,主要模块包括流动模拟、优化算法和性能评估。

关键创新:论文的创新在于将贝叶斯优化与深度强化学习结合,针对高雷诺数流动控制问题提出了新的解决方案,显著提高了气动效率。

关键设计:在贝叶斯优化中,设置了稳态喷流速度的参数;在深度强化学习中,设计了基于瞬时流动信息的奖励机制,强调了奖励设计对探索的影响。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,贝叶斯优化成功识别出稳态喷流速度,使气动效率提高了10.9%,同时阻力减少了9.7%。相比之下,深度强化学习的改进效果有限,未能显著提升效率,强调了奖励设计的重要性。

🎯 应用场景

该研究的成果可广泛应用于航空航天领域,尤其是在设计高升力翼的飞机时,能够有效提高其气动性能和安全性。未来,相关技术也可能扩展到其他流动控制应用,如风力发电和汽车设计等领域。

📄 摘要(原文)

This study investigates active flow control (AFC) of a 30P30N high-lift wing at a Reynolds number Re$_c$ = 450,000 and angle of attack $α$ = 23$^\circ$ using wallresolved large-eddy simulations (LES). Two optimization strategies are explored: open-loop Bayesian optimization (BO) and closed-loop deep reinforcement learning (DRL), both targeting the mitigation of stall and the improvement of aerodynamic efficiency via synthetic jets on the slat, main, and flap elements. The uncontrolled configuration was validated against literature data, confirming the reliability of the LES setup. The BO framework successfully identified steady jet velocities that increased efficiency by +10.9% through a -9.7% drag reduction while maintaining lift. In contrast, the DRL agent, despite leveraging instantaneous flow information from distributed sensors, achieved only minor improvements in lift and drag, with negligible efficiency gain. Training analysis indicated that the penalty-dominated reward constrained exploration. These results highlight the need for carefully designed rewards and computational acceleration strategies in DRL-based flow control at high Reynolds numbers.