Safe Learning-Based Optimization of Model Predictive Control: Application to Battery Fast-Charging

作者: Sebastian Hirt, Andreas Höhl, Johannes Pohlodek, Joachim Schaeffer, Maik Pfefferkorn, Richard D. Braatz, Rolf Findeisen

分类: eess.SY, cs.LG

发布日期: 2024-10-07

备注: 7 pages, 4 figures, submitted to ACC 2025

💡 一句话要点

提出基于安全学习的MPC优化方法，解决电池快充中的模型不确定性问题

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 模型预测控制 贝叶斯优化 安全学习 锂离子电池 快速充电

📋 核心要点

传统MPC在模型不确定性下表现不佳，且成本函数设计困难，限制了其在复杂系统中的应用。
论文提出结合安全贝叶斯优化的MPC方法，通过学习调整控制器参数，无需精确模型即可优化性能。
实验表明，该方法在锂离子电池快充中，相比传统MPC，能在保证安全的前提下缩短充电时间。

📝 摘要（中文）

本文提出了一种将模型预测控制（MPC）与安全贝叶斯优化相结合的方法，旨在解决模型不确定性和成本函数设计难题，从而优化长期闭环性能。通过使用径向基函数网络参数化MPC阶段成本函数，我们采用贝叶斯优化作为一种多幕学习策略来调整控制器，无需精确的系统模型。该方法减轻了MPC成本函数中过于保守的软约束所带来的保守性，并在学习过程中提供概率安全保证，确保以高概率满足安全关键约束。我们将其应用于锂离子电池的快速充电，这是一个具有挑战性的任务，因为电池动力学复杂且安全要求严格，同时要求能够实时实现。仿真结果表明，在模型失配的情况下，与传统的MPC方法相比，我们的方法缩短了充电时间，同时保持了安全性。这项工作扩展了之前的研究，强调了闭环约束满足，并为增强模型不确定性和安全性至关重要的系统的性能提供了一个有希望的解决方案。

🔬 方法详解

问题定义：论文旨在解决模型预测控制（MPC）在存在模型不确定性时，难以优化成本函数和保证安全约束的问题。传统MPC方法对模型精度要求高，且依赖于保守的软约束来处理不确定性，导致性能下降。特别是在锂离子电池快速充电等安全关键应用中，模型失配可能导致严重的安全问题。

核心思路：论文的核心思路是将MPC与安全贝叶斯优化相结合，利用贝叶斯优化在线学习MPC的成本函数参数，从而在模型不确定性下优化闭环性能。通过安全贝叶斯优化，可以在学习过程中提供概率安全保证，确保满足安全关键约束，同时避免过于保守的软约束。

技术框架：整体框架包括MPC控制器和贝叶斯优化器。MPC控制器根据当前状态和优化后的成本函数计算控制输入。贝叶斯优化器根据MPC的闭环性能（如充电时间、安全约束违反情况）更新成本函数参数。具体流程如下：1) 初始化MPC成本函数参数；2) MPC执行控制策略；3) 评估闭环性能；4) 使用安全贝叶斯优化更新成本函数参数；5) 重复步骤2-4，直到收敛。

关键创新：论文的关键创新在于将安全贝叶斯优化与MPC相结合，实现了一种安全、高效的在线学习控制策略。与传统的MPC方法相比，该方法无需精确的系统模型，能够自适应地调整控制器参数，从而在模型不确定性下优化性能并保证安全。此外，安全贝叶斯优化提供了概率安全保证，确保在学习过程中满足安全关键约束。

关键设计：MPC的成本函数使用径向基函数网络（RBF network）进行参数化，RBF网络的中心和宽度是预先设定的，而权重则由贝叶斯优化器进行调整。安全贝叶斯优化器使用高斯过程模型来估计目标函数（如充电时间）和约束函数（如电池电压、电流）的不确定性。采集函数（acquisition function）的设计考虑了探索（exploration）和利用（exploitation）之间的平衡，同时加入了安全约束，确保选择的参数在一定概率下满足安全要求。

🖼️ 关键图片

📊 实验亮点

仿真结果表明，在锂离子电池快速充电应用中，与传统的MPC方法相比，该方法能够在模型失配的情况下显著缩短充电时间，同时保持电池的安全运行。具体而言，在满足安全约束的前提下，充电时间缩短了约10%-20%（具体数值取决于模型失配程度和电池参数）。

🎯 应用场景

该研究成果可应用于各种需要精确控制和安全保障的复杂系统，例如锂离子电池快速充电、自动驾驶、机器人控制等。通过在线学习和优化控制策略，该方法能够提高系统性能，降低对精确模型的需求，并保证安全运行。未来，该方法有望在更多工业领域得到应用，推动智能化控制技术的发展。

📄 摘要（原文）

Model predictive control (MPC) is a powerful tool for controlling complex nonlinear systems under constraints, but often struggles with model uncertainties and the design of suitable cost functions. To address these challenges, we discuss an approach that integrates MPC with safe Bayesian optimization to optimize long-term closed-loop performance despite significant model-plant mismatches. By parameterizing the MPC stage cost function using a radial basis function network, we employ Bayesian optimization as a multi-episode learning strategy to tune the controller without relying on precise system models. This method mitigates conservativeness introduced by overly cautious soft constraints in the MPC cost function and provides probabilistic safety guarantees during learning, ensuring that safety-critical constraints are met with high probability. As a practical application, we apply our approach to fast charging of lithium-ion batteries, a challenging task due to the complicated battery dynamics and strict safety requirements, subject to the requirement to be implementable in real time. Simulation results demonstrate that, in the context of model-plant mismatch, our method reduces charging times compared to traditional MPC methods while maintaining safety. This work extends previous research by emphasizing closed-loop constraint satisfaction and offers a promising solution for enhancing performance in systems where model uncertainties and safety are critical concerns.

Safe Learning-Based Optimization of Model Predictive Control: Application to Battery Fast-Charging

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理