Generating Individual Travel Diaries Using Large Language Models Informed by Census and Land-Use Data

📄 arXiv: 2509.09710v2 📥 PDF

作者: Sepehr Golrokh Amin, Devin Rhoads, Fatemeh Fakhrmoosavi, Nicholas E. Lownes, John N. Ivan

分类: cs.CL, cs.AI, cs.LG

发布日期: 2025-09-07 (更新: 2025-10-20)


💡 一句话要点

提出基于大型语言模型(LLM)的个体出行日记生成方法,利用人口普查和土地利用数据提升生成质量。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 出行日记生成 交通模型 Agent-based模型 人口普查数据 土地利用数据 零样本学习 Jensen-Shannon散度

📋 核心要点

  1. 传统出行日记生成方法依赖大量专有数据,成本高且难以获取,限制了交通模型的应用。
  2. 利用大型语言模型,结合开源人口普查和土地利用数据,直接生成个体出行日记,无需大量人工标注。
  3. 实验表明,LLM生成的日记在总体真实度上与传统方法相当,且在出行目的确定方面表现更优,具有零样本可行性。

📝 摘要(中文)

本研究提出了一种基于大型语言模型(LLM)的方案,用于在基于Agent的交通模型中生成个体出行日记。传统方法依赖于大量的专有家庭出行调查数据,而本研究提出的方法从开源的美国社区调查(ACS)和智能位置数据库(SLD)数据中随机生成人物角色,然后通过直接提示合成日记。本研究提出了一种新颖的“一对多群体真实度”评分,它是四个指标(出行次数评分、时间间隔评分、目的评分和模式评分)的组合,并根据康涅狄格州全州交通研究(CSTS)日记进行验证,并在人口统计变量上进行匹配。验证采用Jensen-Shannon散度来衡量生成日记和真实日记之间的分布相似性。与使用经典方法(出行生成采用负二项分布;模式/目的采用多项Logit模型)在验证集上校准生成的日记相比,LLM生成的日记实现了相当的总体真实度(LLM平均值:0.485 vs. 0.455)。LLM在确定出行目的方面表现出色,并表现出更大的一致性(更窄的真实度评分分布),而经典模型在出行次数和活动持续时间的数值估计方面领先。聚合验证证实了LLM的统计代表性(LLM平均值:0.612 vs. 0.435),证明了LLM的零样本可行性,并为未来的合成日记评估系统建立了一个可量化的日记真实度指标。

🔬 方法详解

问题定义:本研究旨在解决传统出行日记生成方法对大量专有数据的依赖问题。现有方法需要耗费大量资源进行家庭出行调查,数据获取成本高昂且存在隐私问题,限制了交通模型的广泛应用。此外,传统方法在模拟出行目的等复杂行为时,往往难以达到理想的精度和真实度。

核心思路:本研究的核心思路是利用大型语言模型(LLM)的强大生成能力,结合开源的美国社区调查(ACS)和智能位置数据库(SLD)数据,直接生成个体出行日记。通过为LLM提供人物角色和环境信息,引导其生成符合实际情况的出行行为序列。

技术框架:该方法主要包含以下几个阶段:1) 人物角色生成:从ACS和SLD数据中随机生成具有不同人口统计特征和居住地信息的个体;2) 出行日记生成:利用LLM,以生成的人物角色信息作为提示,生成包含出行时间、地点、目的和方式的出行日记;3) 真实度验证:通过提出的“一对多群体真实度”评分,以及Jensen-Shannon散度,将生成的日记与真实日记进行对比,评估生成质量。

关键创新:本研究的关键创新在于:1) 利用LLM直接生成出行日记,避免了传统方法对大量专有数据的依赖;2) 提出了一种新颖的“一对多群体真实度”评分,用于量化评估生成日记的真实度;3) 验证了LLM在零样本条件下的可行性,为未来的合成日记评估系统提供了新的思路。

关键设计:研究中,LLM的具体选择和提示工程(Prompt Engineering)是关键设计。研究人员需要设计合适的提示语,引导LLM生成符合逻辑和实际情况的出行日记。此外,“一对多群体真实度”评分的四个指标(出行次数评分、时间间隔评分、目的评分和模式评分)的权重设置,也会影响最终的评估结果。Jensen-Shannon散度用于衡量生成日记和真实日记在分布上的相似性。

📊 实验亮点

实验结果表明,LLM生成的日记在总体真实度上与使用经典方法生成的日记相当(LLM平均值:0.485 vs. 0.455),并且在确定出行目的方面表现更出色。聚合验证证实了LLM的统计代表性(LLM平均值:0.612 vs. 0.435),证明了LLM在零样本条件下的可行性。LLM生成日记的一致性更高,真实度评分分布更窄。

🎯 应用场景

该研究成果可应用于城市交通规划、交通政策评估、应急疏散模拟等领域。通过生成大规模、高质量的合成出行日记,可以有效降低数据获取成本,提高交通模型的应用范围和精度。此外,该方法还可以用于研究不同人群的出行行为差异,为制定更具针对性的交通政策提供依据。未来,该方法有望扩展到其他领域,如旅游规划、物流优化等。

📄 摘要(原文)

This study introduces a Large Language Model (LLM) scheme for generating individual travel diaries in agent-based transportation models. While traditional approaches rely on large quantities of proprietary household travel surveys, the method presented in this study generates personas stochastically from open-source American Community Survey (ACS) and Smart Location Database (SLD) data, then synthesizes diaries through direct prompting. This study features a novel one-to-cohort realism score: a composite of four metrics (Trip Count Score, Interval Score, Purpose Score, and Mode Score) validated against the Connecticut Statewide Transportation Study (CSTS) diaries, matched across demographic variables. The validation utilizes Jensen-Shannon Divergence to measure distributional similarities between generated and real diaries. When compared to diaries generated with classical methods (Negative Binomial for trip generation; Multinomial Logit for mode/purpose) calibrated on the validation set, LLM-generated diaries achieve comparable overall realism (LLM mean: 0.485 vs. 0.455). The LLM excels in determining trip purpose and demonstrates greater consistency (narrower realism score distribution), while classical models lead in numerical estimates of trip count and activity duration. Aggregate validation confirms the LLM's statistical representativeness (LLM mean: 0.612 vs. 0.435), demonstrating LLM's zero-shot viability and establishing a quantifiable metric of diary realism for future synthetic diary evaluation systems.