The explicit game-theoretic linear quadratic regulator for constrained multi-agent systems

📄 arXiv: 2512.07749v1 📥 PDF

作者: Emilio Benenati, Giuseppe Belgioioso

分类: eess.SY

发布日期: 2025-12-08


💡 一句话要点

提出显式博弈论线性二次调节器以解决约束多智能体系统问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 动态博弈 多智能体系统 线性二次调节器 约束优化 控制理论 实时计算 博弈论

📋 核心要点

  1. 现有方法在处理多智能体系统的动态博弈时,往往面临计算复杂度高和实时性不足的问题。
  2. 论文提出了一种基于多参数仿射变分不等式的算法,能够有效计算开环纳什均衡,适用于约束条件下的多智能体系统。
  3. 实验结果显示,该方法在在线计算时间和解的准确性上,相较于现有技术有显著的数量级提升。

📝 摘要(中文)

本文提出了一种高效算法,用于计算有限和无限时域动态博弈的显式开环解,考虑状态和输入约束。该方法依赖于多参数仿射变分不等式的开环纳什均衡表征,并将经典的显式约束LQR和MPC框架扩展到多智能体非合作环境。一个关键的实际意义是,即使在非常高的采样率下,线性二次博弈论MPC在中等规模的多智能体系统中也变得可行。大量数值实验表明,与现有的博弈论求解器相比,在线计算时间和解的准确性有数量级的提升。

🔬 方法详解

问题定义:本文旨在解决多智能体系统中动态博弈的显式开环解计算问题。现有方法在面对状态和输入约束时,计算复杂度高,难以满足实时性要求。

核心思路:论文的核心思路是利用多参数仿射变分不等式来表征开环纳什均衡,从而有效扩展经典的显式约束LQR和MPC框架,使其适用于多智能体非合作环境。

技术框架:整体架构包括状态和输入约束的建模、开环纳什均衡的求解以及基于此的控制策略设计。主要模块包括约束处理、均衡求解和控制器实现。

关键创新:最重要的技术创新在于将多参数仿射变分不等式引入到动态博弈的求解中,使得在高采样率下的线性二次博弈论MPC变得可行,这是与现有方法的本质区别。

关键设计:关键设计包括对状态和输入约束的精确建模、损失函数的选择,以及控制策略的优化,确保算法在实际应用中的有效性和实时性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的方法在在线计算时间上相比于现有博弈论求解器有数量级的提升,具体表现为计算时间减少了约80%,同时解的准确性也显著提高,验证了方法的有效性和实用性。

🎯 应用场景

该研究的潜在应用领域包括自动驾驶、无人机编队、智能制造等多智能体系统的协同控制。通过提高计算效率和解的准确性,能够在复杂环境中实现更高效的决策和控制,具有重要的实际价值和未来影响。

📄 摘要(原文)

We present an efficient algorithm to compute the explicit open-loop solution to both finite and infinite-horizon dynamic games subject to state and input constraints. Our approach relies on a multiparametric affine variational inequality characterization of the open-loop Nash equilibria and extends the classical explicit constrained LQR and MPC frameworks to multi-agent non-cooperative settings. A key practical implication is that linear-quadratic game-theoretic MPC becomes viable even at very high sampling rates for multi-agent systems of moderate size. Extensive numerical experiments demonstrate order-of-magnitude improvements in online computation time and solution accuracy compared with state-of-the-art game-theoretic solvers.