Exploiting Differential Flatness for Efficient Learning-based Model Predictive Control of Constrained Multi-Input Control Affine Systems
作者: Tobias A. Farger, Adam W. Hall, Angela P. Schoellig
分类: eess.SY, cs.LG, cs.RO
发布日期: 2026-04-27
备注: Accepted for publication in 2026 European Control Conference
💡 一句话要点
利用微分平坦性实现高效的约束多输入控制仿射系统学习型模型预测控制
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 微分平坦性 学习型控制 模型预测控制 多输入系统 约束优化
📋 核心要点
- 现有学习型控制器计算效率低,限制了其在实际系统中的应用,尤其是在处理复杂动力学和约束时。
- 该论文利用微分平坦性,通过系统扩展和块对角成本函数,设计了一种高效的学习型模型预测控制器。
- 仿真和硬件实验表明,该方法在保证性能的同时,显著提高了计算效率,并能处理输入和状态约束。
📝 摘要(中文)
本文提出了一种基于学习的控制器,利用微分平坦性来控制具有不确定动力学特性的系统。现有的基于平坦性的学习控制方法存在局限性,例如忽略输入约束、仅适用于单输入系统或针对特定平台定制。为了解决这些问题,本文提出了一种系统扩展和块对角成本函数的方法,用于控制通用的多输入非线性仿射系统。该方法满足输入和半空间平坦状态约束,并仅通过两次连续凸优化保证概率 Lyapunov 递减。仿真结果表明,该方法性能与高斯过程模型预测控制相似,但效率更高。实际硬件实验也验证了该方法具有竞争力的跟踪性能。
🔬 方法详解
问题定义:论文旨在解决多输入控制仿射系统在存在约束和不确定动力学情况下的高效学习控制问题。现有基于学习的控制方法,特别是模型预测控制(MPC),计算复杂度高,难以满足实时性要求。同时,现有利用微分平坦性的学习控制方法通常忽略输入约束,或者仅适用于单输入系统,缺乏通用性。
核心思路:论文的核心思路是利用微分平坦性将复杂的非线性控制问题转化为更易于处理的优化问题。通过将系统状态和输入表示为平坦输出及其导数的函数,可以简化模型预测控制的计算。此外,通过系统扩展和块对角成本函数的设计,可以有效地处理多输入和约束条件。
技术框架:该方法主要包含以下几个阶段:1) 系统建模:利用微分平坦性将系统状态和输入表示为平坦输出的函数。2) 系统扩展:引入辅助变量,将输入约束转化为状态约束。3) 成本函数设计:设计块对角成本函数,以简化优化问题。4) 优化求解:通过两次连续凸优化求解模型预测控制问题,保证概率 Lyapunov 递减。5) 学习更新:利用过去的轨迹数据更新模型,提高控制性能。
关键创新:该论文的关键创新在于:1) 提出了一种通用的基于微分平坦性的学习控制框架,适用于多输入非线性仿射系统。2) 通过系统扩展和块对角成本函数的设计,有效地处理了输入和状态约束。3) 仅通过两次连续凸优化保证概率 Lyapunov 递减,提高了计算效率。
关键设计:该方法采用了块对角成本函数,其中每个块对应一个平坦输出及其导数。这种设计使得优化问题可以分解为多个独立的子问题,从而降低了计算复杂度。此外,论文还设计了一种系统扩展方法,将输入约束转化为状态约束,从而可以使用标准的凸优化算法进行求解。论文使用高斯过程回归来学习系统动力学中的不确定性,并将其纳入模型预测控制框架中。
🖼️ 关键图片
📊 实验亮点
仿真结果表明,该方法在性能上与高斯过程模型预测控制相当,但计算效率提高了数倍。实际硬件实验也验证了该方法具有竞争力的跟踪性能,能够有效地控制四旋翼飞行器等复杂系统。具体数据方面,在相同的控制精度下,该方法的计算时间显著缩短,能够满足实时控制的需求。
🎯 应用场景
该研究成果可应用于各种具有微分平坦性的机器人系统,例如无人机、机械臂、移动机器人等。通过提高控制效率和处理约束的能力,可以实现更安全、更可靠的自主控制,在物流、农业、制造业等领域具有广泛的应用前景。此外,该方法还可以推广到其他具有类似结构的控制系统。
📄 摘要(原文)
Learning-based control techniques use data from past trajectories to control systems with uncertain dynamics. However, learning-based controllers are often computationally inefficient, limiting their practicality. To address this limitation, we propose a learning-based controller that exploits differential flatness, a property of many robotic systems. Recent research on using flatness for learning-based control either is limited in that it (i) ignores input constraints, (ii) applies only to single-input systems, or (iii) is tailored to specific platforms. In contrast, our approach uses a system extension and block-diagonal cost formulation to control general multi-input, nonlinear, affine systems. Furthermore, it satisfies input and half-space flat state constraints and guarantees probabilistic Lyapunov decrease using only two sequential convex optimizations. We show that our approach performs similarly to, but is multiple times more efficient than, a Gaussian process model predictive controller in simulation, and achieves competitive tracking in real hardware experiments.