Direct transfer of optimized controllers to similar systems using dimensionless MPC

📄 arXiv: 2512.08667v1 📥 PDF

作者: Josip Kir Hromatko, Shambhuraj Sawant, Šandor Ileš, Sébastien Gros

分类: eess.SY, cs.LG

发布日期: 2025-12-09

备注: 7 pages, 4 figures

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于无量纲MPC的控制器迁移方法,实现优化控制器在动态相似系统间的直接迁移。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 无量纲MPC 模型预测控制 控制器迁移 动态相似性 量纲分析

📋 核心要点

  1. 现有控制器迁移方法在动态相似系统间迁移时,通常需要针对目标系统进行额外调整,增加了部署成本。
  2. 该论文提出一种基于无量纲模型预测控制(MPC)的控制器迁移方法,实现优化控制器在动态相似系统间的直接迁移。
  3. 在倒立摆起摆和赛车问题上的实验表明,该方法能够有效迁移控制器,并利用强化学习或贝叶斯优化进行参数调优。

📝 摘要(中文)

缩放模型实验广泛应用于工程领域,以降低实验成本并克服全尺寸系统的约束。此类实验的相关性依赖于量纲分析和动态相似性原理。然而,将控制器迁移到全尺寸系统通常需要额外的调整。本文提出了一种方法,通过无量纲模型预测控制(MPC)实现直接的控制器迁移,并自动调整闭环性能。通过这种重构,优化控制器的闭环行为可以直接迁移到新的、动态相似的系统。此外,无量纲公式允许在参数优化期间使用来自不同尺度系统的数据。我们在倒立摆起摆和赛车问题上验证了该方法,应用强化学习或贝叶斯优化来调整控制器参数。本文用于获得结果的软件可在https://github.com/josipkh/dimensionless-mpcrl公开获取。

🔬 方法详解

问题定义:论文旨在解决控制器在动态相似系统之间迁移时需要额外调整的问题。现有方法通常需要针对目标系统的具体参数进行重新调优,这增加了部署时间和成本,限制了控制器在不同尺度系统中的通用性。

核心思路:论文的核心思路是利用量纲分析和动态相似性原理,将模型预测控制(MPC)问题转化为无量纲形式。通过这种方式,控制器的优化结果不再依赖于系统的具体尺度,而是依赖于无量纲参数之间的关系。因此,在源系统上优化后的控制器可以直接应用于动态相似的目标系统,无需额外调整。

技术框架:该方法主要包含以下几个步骤:1) 对系统进行量纲分析,确定系统的无量纲参数;2) 将模型预测控制(MPC)问题转化为基于无量纲参数的形式;3) 在源系统上,使用强化学习或贝叶斯优化等方法对无量纲MPC控制器的参数进行优化;4) 将优化后的无量纲MPC控制器直接应用于动态相似的目标系统。

关键创新:该方法最重要的创新点在于将模型预测控制(MPC)与量纲分析相结合,提出了无量纲MPC的概念。这种方法使得控制器不再依赖于系统的具体尺度,从而实现了控制器在动态相似系统之间的直接迁移。与现有方法相比,该方法无需针对目标系统进行额外调整,大大降低了部署成本。

关键设计:在具体实现中,需要仔细选择系统的特征量,以确保无量纲参数能够充分描述系统的动态特性。此外,在优化无量纲MPC控制器的参数时,可以使用不同的优化算法,如强化学习或贝叶斯优化。论文中使用了开源的软件库来实现无量纲MPC,并提供了详细的示例代码。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文在倒立摆起摆和赛车问题上验证了该方法的有效性。实验结果表明,通过无量纲MPC,可以在不同尺度的系统之间直接迁移控制器,而无需进行额外的调整。此外,论文还展示了如何使用强化学习和贝叶斯优化来优化无量纲MPC控制器的参数,从而进一步提高控制器的性能。开源代码的提供也方便了其他研究者复现和应用该方法。

🎯 应用场景

该研究成果可广泛应用于机器人、航空航天、汽车工程等领域,尤其适用于需要在不同尺度或不同配置的相似系统之间迁移控制器的场景。例如,可以将小型无人机的控制器直接迁移到大型无人机上,或者将赛车模拟器的控制器迁移到真实的赛车上。该方法能够降低开发成本,加速产品迭代,并提高控制系统的鲁棒性和通用性。

📄 摘要(原文)

Scaled model experiments are commonly used in various engineering fields to reduce experimentation costs and overcome constraints associated with full-scale systems. The relevance of such experiments relies on dimensional analysis and the principle of dynamic similarity. However, transferring controllers to full-scale systems often requires additional tuning. In this paper, we propose a method to enable a direct controller transfer using dimensionless model predictive control, tuned automatically for closed-loop performance. With this reformulation, the closed-loop behavior of an optimized controller transfers directly to a new, dynamically similar system. Additionally, the dimensionless formulation allows for the use of data from systems of different scales during parameter optimization. We demonstrate the method on a cartpole swing-up and a car racing problem, applying either reinforcement learning or Bayesian optimization for tuning the controller parameters. Software used to obtain the results in this paper is publicly available at https://github.com/josipkh/dimensionless-mpcrl.