Joint Estimation and Prediction of City-wide Delivery Demand: A Large Language Model Empowered Graph-based Learning Approach
作者: Tong Nie, Junlin He, Yuewen Mei, Guoyang Qin, Guilong Li, Jian Sun, Wei Ma
分类: cs.LG
发布日期: 2024-08-30 (更新: 2025-03-27)
期刊: Transportation Research Part E: Logistics and Transportation Review, 2025
DOI: 10.1016/j.tre.2025.104075
💡 一句话要点
提出基于大语言模型赋能图学习的城市级配送需求联合估计与预测方法
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 城市配送需求预测 图神经网络 大语言模型 时空学习 跨城市泛化
📋 核心要点
- 现有方法难以同时估计和预测城市范围内的配送需求,并且模型在新城市中的泛化能力不足。
- 利用大语言模型提取地理空间知识编码,并将其融入图神经网络中,以实现跨城市的需求预测。
- 在真实数据集上验证,模型在准确性、效率和可迁移性方面均优于现有方法。
📝 摘要(中文)
电子商务和城市化的快速发展显著加剧了城市地区的配送运营,增加了配送需求的数量和复杂性。数据驱动的预测方法,特别是利用机器学习技术的方法,已经成为解决城市配送需求管理问题的有效手段。然而,城市级配送需求的联合估计与预测,以及模型在新城市中的泛化能力,尚未得到充分解决。为此,本文将该问题形式化为一个可迁移的基于图的时空学习任务。首先,形式化了一个个体-集体消息传递神经网络模型,以捕捉相关区域需求模式之间的交互。其次,利用大语言模型(LLM)的最新进展,我们从非结构化的位置数据中提取通用地理空间知识编码。最后,为了促进模型的跨城市泛化,我们将编码以可迁移的方式集成到需求预测器中。在包括中国和美国的八个城市在内的两个真实世界配送数据集上的综合实证评估结果表明,我们的模型在准确性、效率和可迁移性方面显著优于最先进的基线。
🔬 方法详解
问题定义:论文旨在解决城市范围内配送需求的联合估计与预测问题,并提升模型在不同城市之间的泛化能力。现有方法通常难以捕捉区域间的复杂交互关系,且缺乏利用外部知识来增强模型泛化性的能力。
核心思路:论文的核心思路是利用图神经网络建模区域间的依赖关系,并结合大语言模型提取的地理空间知识,从而提升模型在城市级配送需求预测方面的准确性和泛化能力。通过将地理位置信息编码成向量,并将其融入到图神经网络中,模型可以学习到更丰富的上下文信息。
技术框架:整体框架包含三个主要部分:1) 个体-集体消息传递神经网络,用于捕捉区域间的需求模式交互;2) 大语言模型(LLM),用于从非结构化的位置数据中提取通用地理空间知识编码;3) 可迁移的需求预测器,将LLM编码集成到预测模型中,以促进跨城市泛化。
关键创新:论文的关键创新在于利用大语言模型提取地理空间知识,并将其融入到图神经网络中。这种方法能够有效地利用外部知识来增强模型的泛化能力,使其能够更好地适应新的城市环境。此外,个体-集体消息传递机制能够更有效地捕捉区域间的依赖关系。
关键设计:论文采用了一种个体-集体消息传递机制,允许节点在图神经网络中传递个体信息和集体信息。损失函数的设计旨在平衡预测精度和泛化能力。具体而言,LLM采用的是预训练好的模型,例如BERT或其变体,用于将地理位置描述转换为向量表示。这些向量随后被用作图神经网络的节点特征。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该模型在两个真实世界的配送数据集(包括中国和美国的八个城市)上显著优于最先进的基线模型。在准确性、效率和可迁移性方面均取得了显著提升,证明了该方法的有效性和泛化能力。具体的性能提升数据在论文中进行了详细展示。
🎯 应用场景
该研究成果可应用于城市物流规划、智能配送系统优化、交通流量预测等领域。通过准确预测城市范围内的配送需求,可以帮助企业优化资源配置,降低运营成本,提高服务效率。此外,该方法的可迁移性使其能够快速部署到新的城市,具有广泛的应用前景。
📄 摘要(原文)
The proliferation of e-commerce and urbanization has significantly intensified delivery operations in urban areas, boosting the volume and complexity of delivery demand. Data-driven predictive methods, especially those utilizing machine learning techniques, have emerged to handle these complexities in urban delivery demand management problems. One particularly pressing issue that has yet to be sufficiently addressed is the joint estimation and prediction of city-wide delivery demand, as well as the generalization of the model to new cities. To this end, we formulate this problem as a transferable graph-based spatiotemporal learning task. First, an individual-collective message-passing neural network model is formalized to capture the interaction between demand patterns of associated regions. Second, by exploiting recent advances in large language models (LLMs), we extract general geospatial knowledge encodings from the unstructured locational data using the embedding generated by LLMs. Last, to encourage the cross-city generalization of the model, we integrate the encoding into the demand predictor in a transferable way. Comprehensive empirical evaluation results on two real-world delivery datasets, including eight cities in China and the US, demonstrate that our model significantly outperforms state-of-the-art baselines in accuracy, efficiency, and transferability.