TrajDLM: Topology-Aware Block Diffusion Language Model for Trajectory Generation

作者: Wilson Wongso, Lihuan Li, Arian Prabowo, Xiachong Lin, Baiyu Chen, Hao Xue, Flora D. Salim

分类: cs.LG

发布日期: 2026-05-11

🔗 代码/项目: GITHUB

💡 一句话要点

提出TrajDLM：基于块扩散语言模型的拓扑感知轨迹生成框架，实现高效高保真轨迹合成。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 轨迹生成 块扩散模型 路网拓扑 离散序列建模 生成式人工智能 交通仿真

📋 核心要点

现有轨迹生成方法在连续空间的高效性与离散路网的拓扑约束之间存在显著权衡，难以兼顾生成速度与轨迹的真实性。
提出TrajDLM框架，将轨迹建模为离散路段序列，利用块扩散模型进行高效去噪，并结合路网编码器与拓扑约束采样机制。
实验证明TrajDLM在保持高保真度的同时，生成速度较基线提升2.8倍，并具备出色的跨城市及跨交通模式零样本迁移能力。

📝 摘要（中文）

生成高保真合成GPS轨迹对于交通规划、城市模拟及隐私保护至关重要。现有轨迹生成模型在效率与路网拓扑忠实度之间存在权衡：连续空间方法生成速度快但忽略路网约束，而拓扑感知方法依赖搜索式自回归解码，导致生成速度受限。本文提出TrajDLM，一种基于块扩散语言模型（Block Diffusion Language Model）的拓扑感知轨迹生成框架。TrajDLM将轨迹建模为离散路段序列，结合块扩散骨干网络实现高效去噪，利用路网编码器提取拓扑感知嵌入，并引入拓扑约束采样以确保轨迹的连贯性与真实性。在三个城市级数据集上的实验表明，TrajDLM在细粒度局部相似性指标上表现优异，生成速度较现有方法提升最高达2.8倍，并展现出强大的跨领域零样本迁移能力。

🔬 方法详解

问题定义：论文旨在解决轨迹生成中“效率”与“拓扑忠实度”的矛盾。现有方法要么忽略路网结构导致轨迹脱离实际道路，要么依赖复杂的搜索式自回归解码，导致推理延迟过高，难以满足大规模城市模拟需求。

核心思路：引入块扩散语言模型（Block Diffusion LM），将轨迹视为离散路段序列。通过块级并行去噪替代传统的逐点自回归生成，在保持路网拓扑约束的同时，大幅提升生成效率。

技术框架：整体架构包含三个核心模块：一是路网编码器，用于捕捉空间拓扑特征；二是块扩散骨干网络，负责在离散嵌入空间进行并行去噪；三是拓扑约束采样器，在生成过程中实时过滤非法路径，确保轨迹符合路网连通性。

关键创新：首次将块扩散模型应用于轨迹生成任务，通过并行化处理离散路段序列，打破了传统自回归模型在生成速度上的瓶颈，同时通过拓扑感知嵌入实现了对复杂路网结构的深度建模。

关键设计：采用离散化路段表示，利用扩散过程中的条件引导机制注入路网拓扑信息。损失函数设计上，结合了扩散模型的去噪目标与拓扑一致性约束，确保生成的轨迹序列在空间上是连通且合理的。

🖼️ 关键图片

📊 实验亮点

TrajDLM在三个城市级数据集上表现卓越，在细粒度局部相似性指标上优于现有主流模型。性能方面，其生成速度较传统搜索式自回归方法提升最高达2.8倍。此外，该模型展现了极强的泛化能力，在未见过的城市区域及不同交通模式（如步行、骑行、驾车）下均能实现有效的零样本迁移，验证了块扩散架构在轨迹建模中的鲁棒性与高效性。

🎯 应用场景

该研究在智慧城市建设中具有广泛应用价值。首先，可用于生成大规模合成轨迹数据，解决交通数据隐私保护与数据稀缺问题；其次，支持城市交通规划中的“假设分析”（What-if scenario），如评估新道路建设对交通流的影响；此外，还可应用于自动驾驶仿真测试及公共交通调度优化，为城市交通管理提供高效、低成本的决策支持工具。

📄 摘要（原文）

Generating high-fidelity synthetic GPS trajectories is increasingly important for applications in transportation, urban planning, and what-if scenario simulation, especially as privacy concerns limit access to real-world mobility data. Existing trajectory generation models face a trade-off between efficiency and faithfulness to road network topology: continuous-space methods enable fast generation but ignore the road network, while topology-aware approaches rely on search-based autoregressive decoding that limits generation speed. We propose TrajDLM, a topology-aware trajectory generation framework based on block diffusion language models that bridges this gap. TrajDLM models trajectories as sequences of discrete road segments, combining a block diffusion backbone for efficient denoising, topology-aware embeddings from a road network encoder, and topology-constrained sampling to ensure coherent and realistic trajectories. Across three city-scale datasets, TrajDLM achieves strong performance on fine-grained local similarity metrics while being up to $2.8\times$ faster than prior work, and demonstrates strong zero-shot transfer across domains, including unseen transportation modes. These results highlight the effectiveness of block-wise discrete diffusion as a scalable approach to accurate and efficient trajectory generation. Our code is available at https://github.com/cruiseresearchgroup/TrajDLM/

TrajDLM: Topology-Aware Block Diffusion Language Model for Trajectory Generation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理