FiLMMeD: Feature-wise Linear Modulation for Cross-Problem Multi-Depot Vehicle Routing

📄 arXiv: 2604.28102v1 📥 PDF

作者: Arthur Corrêa, Paulo Nascimento, Samuel Moniz

分类: cs.LG

发布日期: 2026-04-30

🔗 代码/项目: GITHUB


💡 一句话要点

提出FiLMMeD,通过特征线性调制解决跨问题多车场车辆路径问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 多车场车辆路径问题 神经组合优化 特征线性调制 多任务学习 Transformer 课程学习 车辆路径规划

📋 核心要点

  1. 现有神经组合优化方法在解决多车场车辆路径问题(MDVRP)时,泛化能力不足,难以适应不同约束变体。
  2. 提出FiLMMeD模型,通过特征线性调制(FiLM)动态调整Transformer编码器的内部表示,以适应不同的约束条件。
  3. 实验结果表明,FiLMMeD在24种MDVRP变体和16种单车场VRP上均优于现有方法,验证了其有效性。

📝 摘要(中文)

解决实际多车场车辆路径问题(MDVRP)是现代物流中的一项具有挑战性的优化任务,尤其是在电子商务的推动下。为了应对MDVRP的计算复杂性,基于神经组合优化的方法提供了一种有前景的可扩展替代方案。然而,这些方法通常依赖于针对特定问题定制的固定架构和输入编码。在实际环境中,异构约束会产生多种MDVRP变体,限制了此类模型的适用性。虽然多任务学习(MTL)已开始加速统一神经求解器的开发,但先前的工作几乎完全侧重于单车场VRP,而忽略了MDVRP。为了弥合这一差距,我们提出了一种用于跨问题多车场车辆路径的特征线性调制(FiLMMeD),这是一种用于24种不同MDVRP变体的新型统一神经模型。我们主要贡献包括:(1)为了提高模型的泛化能力,我们使用特征线性调制(FiLM)增强了标准的Transformer编码器,该调制基于活动约束集动态地调节学习到的内部表示;(2)我们首次展示了MTL环境中的偏好优化,并将其确立为未来MTL工作的卓越替代方案;(3)为了减轻由于引入多车场约束而引起的泛化差距,我们引入了一种有针对性的课程学习策略,该策略逐步使模型接触到越来越复杂的约束交互。在24种MDVRP变体(包括8种新颖的公式)和16种单车场VRP上的大量实验证实了FiLMMeD的有效性,它始终优于最先进的基线。

🔬 方法详解

问题定义:论文旨在解决多车场车辆路径问题(MDVRP)中,现有神经组合优化方法泛化能力不足的问题。现实世界的MDVRP通常包含多种约束变体,而现有方法依赖于针对特定问题定制的固定架构,难以适应这些变体。这限制了它们在实际场景中的应用。

核心思路:论文的核心思路是利用特征线性调制(FiLM)动态地调节Transformer编码器的内部表示,使其能够根据当前激活的约束集进行调整。通过这种方式,模型可以学习到更具泛化性的特征表示,从而适应不同的MDVRP变体。

技术框架:FiLMMeD模型基于Transformer架构,主要包含一个Transformer编码器和一个解码器(具体解码方式未知)。关键在于编码器部分,它使用FiLM层来调节特征表示。模型的训练采用多任务学习(MTL)框架,同时学习解决多个MDVRP变体。此外,论文还引入了课程学习策略,逐步增加训练数据的复杂性。

关键创新:最重要的创新点在于FiLM层在MDVRP中的应用。FiLM层允许模型根据当前激活的约束集动态地调整特征表示,从而提高了模型的泛化能力。此外,论文还探索了偏好优化在MTL环境中的应用,并提出了一种针对MDVRP的课程学习策略。

关键设计:论文中关于FiLM层的具体实现细节(例如,如何将约束信息编码为FiLM层的输入)以及课程学习策略的具体步骤(例如,如何定义训练数据的复杂性)的描述较为简略,具体参数设置未知。损失函数可能与车辆路径问题的优化目标相关,例如最小化总行驶距离。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

FiLMMeD在24种MDVRP变体和16种单车场VRP上进行了广泛的实验,结果表明FiLMMeD始终优于最先进的基线方法。具体性能提升数据未知,但论文强调了其在不同问题变体上的泛化能力和一致性表现。此外,论文还验证了偏好优化在MTL环境中的有效性,并展示了课程学习策略对模型性能的提升。

🎯 应用场景

该研究成果可应用于物流、供应链管理、交通运输等领域,用于优化多车场车辆路径规划,降低运输成本,提高效率。特别是在电商物流等场景下,可以根据不同的约束条件(如时间窗、车辆容量、配送优先级等)快速生成高效的配送方案。未来,该方法有望扩展到更复杂的车辆路径问题,例如考虑动态交通状况、实时订单等因素。

📄 摘要(原文)

Solving practical multi-depot vehicle routing problems (MDVRP) is a challenging optimization task central to modern logistics, increasingly driven by e-commerce. To address the MDVRP's computational complexity, neural-based combinatorial optimization methods offer a promising scalable alternative to traditional approaches. However, neural-based methods typically rely on rigid architectures and input encodings tailored to specific problem formulations. In real-world settings, heterogeneous constraints create multiple MDVRP variants, limiting the applicability of such models. While multi-task learning (MTL) has begun to accelerate the development of unified neural-based solvers, prior works focus almost exclusively on single-depot VRPs, leaving the MDVRP unaddressed. To bridge this gap, we propose Feature-wise Linear Modulation for Cross-Problem Multi-Depot Vehicle Routing (FiLMMeD), a novel unified neural-based model for 24 different MDVRP variants. We introduce three main contributions: (1) to improve the model's generalization, we augment the standard Transformer encoder with Feature-wise Linear Modulation (FiLM), which dynamically conditions learned internal representations based on the active set of constraints; (2) we provide an initial demonstration of Preference Optimization in the MTL setting, establishing it as a superior alternative to Reinforcement Learning for future MTL works; (3) to mitigate the generalization gap caused by the introduction of multi-depot constraints, we introduce a targeted curriculum learning strategy that progressively exposes the model to increasingly more complex constraint interactions. Extensive experiments on 24 MDVRP variants (including 8 novel formulations) and 16 single-depot VRPs confirm the effectiveness of FiLMMeD, which consistently outperforms state-of-the-art baselines. Our code is available at: https://github.com/AJ-Correa/FiLMMeD/tree/main