Conformal Data-driven Control of Stochastic Multi-Agent Systems under Collaborative Signal Temporal Logic Specifications

📄 arXiv: 2504.04615v2 📥 PDF

作者: Eleftherios E. Vlahakis, Lars Lindemann, Dimos V. Dimarogonas

分类: eess.SY, cs.MA

发布日期: 2025-04-06 (更新: 2025-08-25)

备注: 7 pages, 2 figures, Accepted for presentation at the 64th IEEE Conference on Decision and Control (CDC2025)


💡 一句话要点

提出一种基于数据的保形预测控制方法,解决随机多智能体系统在协作时序逻辑约束下的控制问题。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 多智能体系统 保形预测 随机控制 信号时序逻辑 分布式控制 机会约束 数据驱动控制

📋 核心要点

  1. 现有方法难以处理随机多智能体系统在复杂协作时序逻辑约束下的控制问题,尤其是在不依赖扰动分布的条件下。
  2. 论文提出一种基于数据的保形预测控制方法,通过扰动反馈控制和保形预测来约束随机误差,并利用Lipschitz收紧解决联合机会约束。
  3. 通过分解确定性问题为智能体级别子问题,实现了分布式控制策略,并通过实验验证了该方法的有效性。

📝 摘要(中文)

本文研究了随机离散时间线性多智能体系统的控制综合问题,目标是在联合机会约束的协作信号时序逻辑规范下,以无分布的方式,利用可用的扰动样本(分为训练集和校准集)进行控制。利用线性特性,我们将每个智能体的系统分解为确定性标称部分和随机误差部分,并通过求解训练数据上的易处理优化问题来设计扰动反馈控制器,以约束随机误差。然后,我们使用保形预测和校准数据,量化与协作任务相关的智能体集群的聚合误差轨迹的预测区域(PR)。这使我们能够通过 Lipschitz 收紧和计算出的 PR 来解决指定的联合机会约束,并将集中的随机最优控制问题放宽为确定性问题,其解提供了前馈输入。为了提高可扩展性,我们将确定性问题分解为以 MPC 方式求解的智能体级别子问题,从而产生分布式控制策略。最后,我们提供了一个示例,并与 [1] 进行了比较。

🔬 方法详解

问题定义:论文旨在解决随机离散时间线性多智能体系统在协作信号时序逻辑(STL)约束下的控制问题。现有方法通常需要对扰动分布进行假设,或者难以处理多智能体之间的协作关系,导致控制策略的鲁棒性和可扩展性受限。此外,满足联合机会约束也是一个挑战,因为需要保证多个智能体同时满足各自的约束条件。

核心思路:论文的核心思路是利用扰动反馈控制来抑制随机误差,并使用保形预测来量化误差轨迹的预测区域。通过将随机最优控制问题转化为确定性问题,并采用Lipschitz收紧技术来处理联合机会约束,从而简化了控制策略的设计。此外,论文还通过分解确定性问题为智能体级别的子问题,实现了分布式控制策略,提高了系统的可扩展性。

技术框架:该方法主要包含以下几个阶段: 1. 系统分解:将每个智能体的系统分解为确定性标称部分和随机误差部分。 2. 扰动反馈控制:设计扰动反馈控制器,通过求解训练数据上的优化问题来约束随机误差。 3. 保形预测:使用保形预测和校准数据,量化智能体集群的聚合误差轨迹的预测区域。 4. 机会约束处理:通过Lipschitz收紧和计算出的预测区域,解决联合机会约束。 5. 确定性问题转化:将随机最优控制问题转化为确定性问题。 6. 分布式控制:将确定性问题分解为智能体级别的子问题,并采用MPC方法求解。

关键创新:论文的关键创新在于: 1. 提出了一种基于数据的保形预测控制方法,无需对扰动分布进行假设。 2. 利用Lipschitz收紧技术,有效地处理了联合机会约束。 3. 通过分解确定性问题,实现了分布式控制策略,提高了系统的可扩展性。

关键设计: 1. 扰动反馈控制器设计:通过求解训练数据上的优化问题来设计扰动反馈控制器,目标是最小化随机误差的上限。 2. 保形预测区域计算:使用校准数据和保形预测算法,计算智能体集群的聚合误差轨迹的预测区域,保证预测区域的覆盖率满足一定的置信水平。 3. Lipschitz收紧参数选择:根据系统的Lipschitz常数和预测区域的大小,选择合适的收紧参数,以保证联合机会约束的满足。

🖼️ 关键图片

img_0

📊 实验亮点

论文通过实验验证了所提出方法的有效性。实验结果表明,该方法能够在满足协作信号时序逻辑约束的前提下,有效地控制随机多智能体系统。与现有方法相比,该方法具有更好的鲁棒性和可扩展性,能够在更大规模的智能体系统中实现分布式控制。

🎯 应用场景

该研究成果可应用于多智能体协作控制领域,例如无人机集群协同搜索、自动驾驶车辆编队行驶、机器人协同装配等。通过该方法,可以在不依赖精确扰动模型的情况下,保证多智能体系统在复杂环境下的安全性和可靠性,具有重要的实际应用价值。

📄 摘要(原文)

We address control synthesis of stochastic discrete-time linear multi-agent systems under jointly chance-constrained collaborative signal temporal logic specifications in a distribution-free manner using available disturbance samples, which are partitioned into training and calibration sets. Leveraging linearity, we decompose each agent's system into deterministic nominal and stochastic error parts, and design disturbance feedback controllers to bound the stochastic errors by solving a tractable optimization problem over the training data. We then quantify prediction regions (PRs) for the aggregate error trajectories corresponding to agent cliques, involved in collaborative tasks, using conformal prediction and calibration data. This enables us to address the specified joint chance constraint via Lipschitz tightening and the computed PRs, and relax the centralized stochastic optimal control problem to a deterministic one, whose solution provides the feedforward inputs. To enhance scalability, we decompose the deterministic problem into agent-level subproblems solved in an MPC fashion, yielding a distributed control policy. Finally, we present an illustrative example and a comparison with [1].