Learning Flatness-Preserving Residuals for Pure-Feedback Systems

作者: Fengjun Yang, Jake Welde, Nikolai Matni

分类: eess.SY

发布日期: 2025-04-06 (更新: 2025-04-09)

💡 一句话要点

提出一种保扁平性的残差学习方法，用于提升纯反馈系统的控制性能。

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 残差学习 扁平性 纯反馈系统 微分同胚 四旋翼飞行器

📋 核心要点

传统残差学习可能破坏系统扁平性，导致基于扁平性的控制方法失效。
提出保扁平性的残差学习框架，利用下三角结构的残差保证系统扁平性。
实验表明，该方法在四旋翼飞行器控制中，跟踪误差降低5倍，计算速度提升20倍。

📝 摘要（中文）

本文研究了微分扁平系统的残差动力学学习，其中标称模型通过从数据中学习到的校正项进行增强。一个关键挑战是，通用的残差参数化可能会破坏扁平性，从而限制了基于扁平性的规划和控制方法的适用性。为了解决这个问题，我们提出了一个框架，用于在标称模型具有纯反馈形式的系统中学习保扁平性的残差动力学。我们证明了具有下三角结构的残差既保留了系统的扁平性，又保留了原始的扁平输出。此外，我们提供了一个建设性的程序，从标称模型的扁平微分同胚中恢复增强系统的扁平微分同胚。然后，我们介绍了一种学习算法，该算法使用平滑函数逼近器从轨迹数据中拟合此类残差。我们的方法在受未建模空气动力学效应影响的2D四旋翼飞行器的仿真中得到了验证。结果表明，由此产生的学习到的扁平模型能够实现与非线性模型预测控制相当的跟踪性能（跟踪误差比标称扁平模型低5倍），同时在计算速度上提高了20倍以上。

🔬 方法详解

问题定义：论文旨在解决微分扁平系统在进行残差学习时，由于引入的残差项破坏了系统的扁平性，导致无法直接应用基于扁平性的规划和控制方法的问题。现有方法通常忽略了扁平性保持，导致控制性能下降或计算复杂度增加。

核心思路：核心思路是设计一种特殊的残差结构，确保在学习过程中保持系统的扁平性。具体而言，论文证明了对于具有纯反馈形式的标称模型，如果残差具有下三角结构，则可以保证增强后的系统仍然是扁平的，并且原始的扁平输出保持不变。

技术框架：整体框架包括以下几个步骤：1) 确定具有纯反馈形式的标称模型；2) 设计具有下三角结构的残差项；3) 利用轨迹数据学习残差项的参数，使用平滑函数逼近器（如神经网络）进行拟合；4) 从标称模型的扁平微分同胚中恢复增强系统的扁平微分同胚；5) 将学习到的扁平模型应用于控制任务。

关键创新：最重要的技术创新点在于提出了保扁平性的残差结构，即下三角结构的残差。与现有方法相比，该方法能够显式地保证学习后的系统仍然是扁平的，从而可以直接利用基于扁平性的控制方法，避免了复杂的非线性控制设计或额外的扁平化步骤。

关键设计：关键设计包括：1) 残差的下三角结构，保证了扁平性；2) 使用平滑函数逼近器（如神经网络）来参数化残差，以便从数据中学习；3) 提出了从标称模型的扁平微分同胚中恢复增强系统的扁平微分同胚的构造性方法。损失函数通常采用均方误差等回归损失，用于拟合轨迹数据。

🖼️ 关键图片

📊 实验亮点

在2D四旋翼飞行器的仿真实验中，与标称扁平模型相比，使用学习到的扁平模型进行跟踪控制，跟踪误差降低了5倍。同时，由于可以直接应用基于扁平性的控制方法，计算速度提高了20倍以上，达到了与非线性模型预测控制相当的跟踪性能。

🎯 应用场景

该研究成果可应用于各种具有纯反馈形式的微分扁平系统，例如飞行器、机器人等。通过学习保扁平性的残差动力学，可以提高控制系统的精度和鲁棒性，并降低计算复杂度，从而实现更高效、更可靠的自主控制。

📄 摘要（原文）

We study residual dynamics learning for differentially flat systems, where a nominal model is augmented with a learned correction term from data. A key challenge is that generic residual parameterizations may destroy flatness, limiting the applicability of flatness-based planning and control methods. To address this, we propose a framework for learning flatness-preserving residual dynamics in systems whose nominal model admits a pure-feedback form. We show that residuals with a lower-triangular structure preserve both the flatness of the system and the original flat outputs. Moreover, we provide a constructive procedure to recover the flatness diffeomorphism of the augmented system from that of the nominal model. We then introduce a learning algorithm that fits such residuals from trajectory data using smooth function approximators. Our approach is validated in simulation on a 2D quadrotor subject to unmodeled aerodynamic effects. We demonstrate that the resulting learned flat model enables tracking performance comparable to nonlinear model predictive control ($5\times$ lower tracking error than the nominal flat model) while also achieving over a $20\times$ speedup in computation.

Learning Flatness-Preserving Residuals for Pure-Feedback Systems

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理