Learning-based model predictive control for passenger-oriented train rescheduling with flexible train composition
作者: Xiaoyu Liu, Caio Fabio Oliveira da Silva, Azita Dabiri, Yihui Wang, Bart De Schutter
分类: eess.SY
发布日期: 2025-02-21 (更新: 2025-07-31)
备注: 14 pages, 14 figures, submitted to journal
💡 一句话要点
提出基于学习的MPC方法,解决考虑灵活编组的客运列车实时重调度问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 列车重调度 模型预测控制 长短期记忆网络 灵活编组 城市轨道交通
📋 核心要点
- 现有列车重调度方法难以有效处理时变乘客需求和灵活编组带来的复杂性。
- 采用学习型MPC,LSTM预测整数变量,非线性优化确定连续变量,兼顾效率与约束。
- 数值实验基于北京城市轨道交通数据,验证了该学习型MPC方法的有效性。
📝 摘要(中文)
本文提出了一种基于学习的模型预测控制(MPC)方法,用于解决考虑灵活列车编组和车辆循环的面向乘客的实时列车重调度问题,该方法集成了基于学习和基于优化的方法。该方法利用预训练的长短期记忆(LSTM)网络获得整数变量的值,并通过非线性约束优化确定连续变量。通过结合基于学习和基于优化的方法,该方法能够兼顾效率和约束满足。为了减少整数变量的数量,开发了四种预处理技术来修剪整数决策变量的子集。基于北京城市轨道交通系统真实数据的数值模拟验证了所开发方法的有效性。
🔬 方法详解
问题定义:论文旨在解决城市轨道交通中,面对动态变化的乘客需求,如何进行实时列车重调度,同时考虑灵活的列车编组和车辆循环利用。传统方法难以同时处理这些复杂因素,导致调度效率低下,无法有效满足乘客需求。
核心思路:论文的核心思路是将基于学习的方法与基于优化的方法相结合。利用LSTM网络学习历史数据,预测列车编组等整数变量,从而降低优化问题的复杂度。然后,通过非线性约束优化方法确定列车运行时间等连续变量,以实现整体调度目标。
技术框架:该方法采用学习型MPC框架。首先,利用预训练的LSTM网络预测整数决策变量(如列车编组方案)。然后,将这些预测值作为约束条件,输入到非线性优化模型中,求解连续决策变量(如列车运行时间)。MPC框架滚动优化,根据实时乘客需求调整调度方案。
关键创新:该方法最重要的创新在于将LSTM网络与非线性优化相结合,利用学习方法降低了优化问题的维度,从而提高了实时调度的效率。此外,论文还提出了四种预处理技术,进一步减少了整数变量的数量,加速了求解过程。
关键设计:LSTM网络结构的选择和训练数据的准备是关键。损失函数需要综合考虑调度效率和乘客满意度。非线性优化模型需要精确描述列车运行的物理约束和运营规则。预处理技术的有效性取决于对问题结构的深入理解。
🖼️ 关键图片
📊 实验亮点
论文基于北京城市轨道交通的真实数据进行了数值模拟,结果表明,所提出的学习型MPC方法能够有效地进行列车重调度。具体性能数据未知,但论文强调该方法在效率和约束满足方面均表现良好,验证了其在实际应用中的潜力。
🎯 应用场景
该研究成果可应用于城市轨道交通的智能调度系统,提升列车运行效率,降低运营成本,并提高乘客出行体验。通过实时调整列车编组和运行计划,可以更好地适应客流变化,减少拥挤,缩短等待时间。此外,该方法还可推广到其他交通运输领域,如航空、公路等。
📄 摘要(原文)
This paper focuses on passenger-oriented real-time train rescheduling, considering flexible train composition and rolling stock circulation, by integrating learning-based and optimization-based approaches. A learning-based model predictive control (MPC) approach is developed for real-time train rescheduling with flexible train composition and rolling stock circulation to address time-varying passenger demands. In the proposed approach, the values of the integer variables are obtained by pre-trained long short-term memory (LSTM) networks, while the continuous variables are determined through nonlinear constrained optimization. The learning-based MPC approach enables us to jointly consider efficiency and constraint satisfaction by combining learning-based and optimization-based approaches. In order to reduce the number of integer variables, four presolve techniques are developed to prune a subset of integer decision variables. Numerical simulations based on real-life data from the Beijing urban rail transit system are conducted to illustrate the effectiveness of the developed learning-based MPC approach.