Reference-Free Iterative Learning Model Predictive Control with Neural Certificates
作者: Wataru Hashimoto, Kazumune Hashimoto, Masako Kishida, Shigemasa Takai
分类: eess.SY
发布日期: 2025-07-18
备注: This paper was submitted to IET Control Theory & Applications on May 19, 2025 (under review)
💡 一句话要点
提出基于神经证书的无参考迭代学习模型预测控制,提升在线计算效率。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 模型预测控制 迭代学习 神经证书函数 控制李雅普诺夫障碍函数 无参考控制
📋 核心要点
- 现有基于混合整数规划的迭代学习MPC方法存在数值计算困难,限制了其应用。
- 利用神经证书函数(基于CLBF)来定义MPC的终端集和成本,实现迭代优化。
- 实验表明,该方法能迭代提升控制性能,并显著提高在线计算效率。
📝 摘要(中文)
本文提出了一种新颖的无参考迭代学习模型预测控制(MPC)方法。该方法利用从过去控制执行中收集的数据学习一个基于控制李雅普诺夫障碍函数(CLBF)概念的证书函数,并将其用于定义当前迭代中MPC优化问题的终端集和成本。这种方案能够逐步改进MPC的终端组件。与依赖混合整数规划并存在数值困难的现有方法不同,该方法将MPC优化问题表述为标准非线性规划,从而实现更高效的在线计算。该方法满足关键的MPC性质,包括递归可行性和渐近稳定性。此外,在一定假设下,我们证明了性能成本随着迭代次数的增加而单调递减。包括使用PyBullet进行的仿真在内的数值实验证实,我们的控制方案迭代地提高控制性能,并显著提高在线计算效率。
🔬 方法详解
问题定义:论文旨在解决传统迭代学习模型预测控制(MPC)方法中存在的计算效率问题,特别是当使用混合整数规划时,计算复杂度高,难以满足实时性要求。现有的方法在处理复杂系统时,往往面临数值求解的困难,限制了其应用范围。
核心思路:论文的核心思路是利用数据驱动的方法,通过学习一个基于控制李雅普诺夫障碍函数(CLBF)的神经证书函数,来指导MPC的迭代优化过程。该证书函数用于定义MPC优化问题的终端集和成本函数,从而避免了对参考轨迹的依赖,并允许MPC在每次迭代中逐步改进其性能。
技术框架:整体框架包含数据收集、神经证书函数学习和MPC优化三个主要阶段。首先,系统在初始控制策略下运行,收集控制数据。然后,利用收集到的数据训练神经证书函数,该函数能够评估系统的安全性和稳定性。最后,将学习到的神经证书函数集成到MPC的优化问题中,用于定义终端集和成本函数。在后续的迭代中,重复上述过程,不断更新神经证书函数和MPC策略。
关键创新:该方法最重要的创新在于使用神经证书函数来替代传统的终端约束和成本函数,从而将MPC的优化问题转化为一个标准的非线性规划问题,避免了混合整数规划带来的计算负担。此外,该方法是无参考的,不需要预先定义参考轨迹,更适用于复杂和动态环境。
关键设计:神经证书函数的网络结构和损失函数的设计至关重要。网络结构需要能够有效地表达CLBF,损失函数需要能够保证证书函数的有效性和安全性。此外,MPC的优化问题需要合理设置成本函数和约束条件,以保证系统的稳定性和性能。具体的参数设置和网络结构的选择可能需要根据具体的应用场景进行调整。
🖼️ 关键图片
📊 实验亮点
数值实验表明,该方法能够迭代地提高控制性能,并显著提高在线计算效率。与现有方法相比,该方法将MPC的优化问题转化为标准非线性规划,避免了混合整数规划带来的计算负担,从而显著降低了在线计算时间。具体性能提升数据未知,但论文强调了计算效率的显著提高。
🎯 应用场景
该研究成果可应用于机器人控制、自动驾驶、过程控制等领域。特别是在需要高实时性和安全性的场景下,例如无人机编队、机器人操作等,该方法能够提供一种高效且可靠的控制方案。未来,该方法有望推广到更复杂的系统和环境,实现更智能化的控制。
📄 摘要(原文)
In this paper, we propose a novel reference-free iterative learning model predictive control (MPC). In the proposed method, a certificate function based on the concept of Control Lyapunov Barrier Function (CLBF) is learned using data collected from past control executions and used to define the terminal set and cost in the MPC optimization problem at the current iteration. This scheme enables the progressive refinement of the MPC's terminal components over successive iterations. Unlike existing methods that rely on mixed-integer programming and suffer from numerical difficulties, the proposed approach formulates the MPC optimization problem as a standard nonlinear program, enabling more efficient online computation. The proposed method satisfies key MPC properties, including recursive feasibility and asymptotic stability. Additionally, we demonstrate that the performance cost is non-increasing with respect to the number of iterations, under certain assumptions. Numerical experiments including the simulation with PyBullet confirm that our control scheme iteratively enhances control performance and significantly improves online computational efficiency compared to the existing methods.