HiCoTraj:Zero-Shot Demographic Reasoning via Hierarchical Chain-of-Thought Prompting from Trajectory
作者: Junyi Xie, Yuankun Jiao, Jina Kim, Yao-Yi Chiang, Lingyi Zhao, Khurram Shafique
分类: cs.AI
发布日期: 2025-10-14
备注: accepted by The 1st ACM SIGSPATIAL International Workshop on Generative and Agentic AI for Multi-Modality Space-Time Intelligence
💡 一句话要点
HiCoTraj:利用轨迹分层思维链提示实现零样本人口统计推理
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 零样本学习 人口统计推断 轨迹数据 大型语言模型 思维链提示 可解释性 行为模式分析
📋 核心要点
- 现有基于轨迹的人口统计推断方法依赖大量标注数据,泛化性差,缺乏可解释性。
- HiCoTraj利用LLM的零样本学习能力,通过分层思维链提示,从轨迹数据直接推理人口统计属性。
- 实验表明,HiCoTraj在真实轨迹数据上,零样本场景下实现了具有竞争力的性能。
📝 摘要(中文)
从人类移动模式推断年龄、性别或收入水平等人口统计属性,能够支持有针对性的公共卫生干预、公平的城市规划和个性化的交通服务等关键应用。现有的基于移动性的人口统计推断研究严重依赖带有标签的大规模轨迹数据,导致可解释性有限,并且在不同的数据集和用户群体中的泛化能力较差。我们提出了HiCoTraj(基于轨迹的分层思维链提示的零样本人口统计推理),该框架利用大型语言模型(LLM)的零样本学习和语义理解能力,在没有标记训练数据的情况下执行人口统计推断。HiCoTraj通过创建详细的活动记录和多尺度访问摘要,将轨迹转换为语义丰富的自然语言表示。然后,HiCoTraj使用一种新颖的分层思维链推理,系统地引导LLM完成三个认知阶段:事实特征提取、行为模式分析和具有结构化输出的人口统计推断。这种方法解决了标记人口统计数据稀缺的挑战,同时提供了透明的推理链。在真实轨迹数据上的实验评估表明,HiCoTraj在零样本场景中,在多种人口统计属性上实现了具有竞争力的性能。
🔬 方法详解
问题定义:现有基于轨迹的人口统计推断方法需要大量带有标签的轨迹数据进行训练,这限制了它们在数据稀缺场景下的应用。此外,这些方法通常是黑盒模型,缺乏可解释性,难以理解其推理过程。不同数据集和用户群体之间存在差异,导致模型泛化能力较差。
核心思路:HiCoTraj的核心思路是利用大型语言模型(LLM)的零样本学习能力和语义理解能力,直接从轨迹数据推断人口统计属性,而无需任何训练数据。通过将轨迹转换为自然语言描述,并使用分层思维链提示,引导LLM进行推理,从而实现可解释的零样本人口统计推断。
技术框架:HiCoTraj框架包含以下三个主要阶段:1) 轨迹语义表示:将轨迹数据转换为自然语言描述,包括详细的活动记录和多尺度访问摘要。2) 分层思维链推理:使用分层思维链提示,引导LLM完成三个认知阶段:事实特征提取、行为模式分析和人口统计推断。3) 结构化输出:将LLM的推理结果转换为结构化的输出,例如年龄、性别和收入水平。
关键创新:HiCoTraj的关键创新在于其分层思维链提示方法,该方法系统地引导LLM进行推理,从而提高了推理的准确性和可解释性。与现有方法相比,HiCoTraj不需要任何训练数据,并且能够提供透明的推理链。
关键设计:HiCoTraj的关键设计包括:1) 活动记录的详细程度和多尺度访问摘要的尺度选择。2) 分层思维链提示的结构和内容,包括每个认知阶段的具体提示。3) LLM的选择和参数设置,例如温度参数和最大生成长度。具体提示工程细节未知。
🖼️ 关键图片
📊 实验亮点
HiCoTraj在真实轨迹数据上进行了实验评估,结果表明,在零样本场景下,HiCoTraj在多种人口统计属性上实现了具有竞争力的性能。具体性能数据未知,但论文强调了其在零样本学习方面的优势,以及与需要大量标注数据的传统方法相比的优越性。HiCoTraj能够提供透明的推理链,提高了模型的可解释性。
🎯 应用场景
HiCoTraj可应用于多个领域,包括公共卫生、城市规划和交通服务。例如,可以利用HiCoTraj识别高风险人群,制定有针对性的公共卫生干预措施;分析城市居民的出行模式,优化城市规划;根据用户的出行习惯,提供个性化的交通服务。该研究有助于在数据隐私保护的前提下,更好地理解和利用人类移动数据。
📄 摘要(原文)
Inferring demographic attributes such as age, sex, or income level from human mobility patterns enables critical applications such as targeted public health interventions, equitable urban planning, and personalized transportation services. Existing mobility-based demographic inference studies heavily rely on large-scale trajectory data with demographic labels, leading to limited interpretability and poor generalizability across different datasets and user groups. We propose HiCoTraj (Zero-Shot Demographic Reasoning via Hierarchical Chain-of-Thought Prompting from Trajectory), a framework that leverages LLMs' zero-shot learning and semantic understanding capabilities to perform demographic inference without labeled training data. HiCoTraj transforms trajectories into semantically rich, natural language representations by creating detailed activity chronicles and multi-scale visiting summaries. Then HiCoTraj uses a novel hierarchical chain of thought reasoning to systematically guide LLMs through three cognitive stages: factual feature extraction, behavioral pattern analysis, and demographic inference with structured output. This approach addresses the scarcity challenge of labeled demographic data while providing transparent reasoning chains. Experimental evaluation on real-world trajectory data demonstrates that HiCoTraj achieves competitive performance across multiple demographic attributes in zero-shot scenarios.