HouseTS: A Large-Scale, Multimodal Spatiotemporal U.S. Housing Dataset

📄 arXiv: 2506.00765v1 📥 PDF

作者: Shengkun Wang, Yanshen Sun, Fanglan Chen, Linhan Wang, Naren Ramakrishnan, Chang-Tien Lu, Yinlin Chen

分类: cs.AI

发布日期: 2025-06-01


💡 一句话要点

HouseTS:一个大规模多模态时空美国房价数据集,用于长时程预测。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 房价预测 时空数据 多模态数据 大数据集 深度学习 时间序列分析 城市规划 房地产

📋 核心要点

  1. 现有的房价预测基准数据集缺乏足够的时空深度和丰富的上下文信息,难以支持长时程预测。
  2. HouseTS数据集通过整合房价、POI、社会经济指标和房地产指标等多模态数据,提供更全面的信息。
  3. 论文评估了多种模型,并展示了HouseTS在多模态案例研究中的价值,为城市演变提供了可解释的见解。

📝 摘要(中文)

本文提出了HouseTS,一个大规模多模态数据集,覆盖了美国30个主要都市区6000个邮政编码区域,从2012年3月到2023年12月的月度房价数据。该数据集包含超过89万条记录,并富含兴趣点(POI)、社会经济指标和详细的房地产指标。为了建立标准化的性能基线,作者评估了14个模型,涵盖了经典的统计方法、深度神经网络(DNN)和预训练时间序列基础模型。此外,论文还通过一个多模态案例研究展示了HouseTS的价值,其中视觉语言模型从带时间戳的卫星图像中提取地理变化的结构化文本描述,从而为城市演变提供可解释的、基于事实的见解。HouseTS托管在Kaggle上,所有预处理流程、基准代码和文档都公开维护在GitHub上,以确保完全的可重复性和易于采用。

🔬 方法详解

问题定义:房价预测对于投资者、规划者和研究人员至关重要。然而,现有数据集在时空深度和上下文丰富度方面存在不足,难以支持长时程的房价预测,阻碍了相关研究的进展。缺乏可复现的基准也限制了不同方法的比较和改进。

核心思路:论文的核心思路是构建一个大规模、多模态的房价数据集,该数据集不仅包含房价信息,还整合了影响房价的各种因素,如POI、社会经济指标和房地产指标等。通过提供更丰富的信息,HouseTS旨在提高房价预测的准确性和可解释性。

技术框架:HouseTS数据集的构建流程主要包括数据收集、数据清洗、数据整合和数据增强等步骤。首先,从多个来源收集房价、POI、社会经济指标和房地产指标等数据。然后,对收集到的数据进行清洗和预处理,去除噪声和异常值。接着,将不同来源的数据整合到统一的数据集中。最后,通过一些数据增强技术,如时间序列插值和特征工程,来扩充数据集的规模和多样性。

关键创新:HouseTS的关键创新在于其大规模、多模态的数据整合能力。与现有数据集相比,HouseTS覆盖了更广阔的地理范围、更长的时间跨度,并包含了更丰富的上下文信息。此外,论文还展示了如何利用视觉语言模型从卫星图像中提取地理变化的结构化文本描述,为房价预测提供更深入的见解。

关键设计:HouseTS数据集包含了多种类型的数据,包括房价、POI、社会经济指标和房地产指标等。房价数据来源于Zillow等房地产网站,POI数据来源于Google Maps API,社会经济指标数据来源于美国人口普查局,房地产指标数据来源于CoreLogic等房地产数据提供商。数据集的时间跨度为2012年3月至2023年12月,时间粒度为月度。数据集的地理范围覆盖了美国30个主要都市区的6000个邮政编码区域。

🖼️ 关键图片

img_0

📊 实验亮点

论文通过实验验证了HouseTS数据集的有效性。作者评估了14个模型,包括经典的统计方法、深度神经网络和预训练时间序列基础模型。实验结果表明,HouseTS数据集可以显著提高房价预测的准确性。此外,论文还展示了如何利用视觉语言模型从卫星图像中提取地理变化的结构化文本描述,为房价预测提供更深入的见解。

🎯 应用场景

HouseTS数据集可广泛应用于房地产投资分析、城市规划、政策制定等领域。投资者可以利用该数据集进行房价预测,辅助投资决策。城市规划者可以利用该数据集了解城市发展趋势,优化资源配置。政策制定者可以利用该数据集评估政策效果,制定更有效的房地产政策。此外,该数据集还可以用于研究城市演变、社会经济发展等问题。

📄 摘要(原文)

Accurate house-price forecasting is essential for investors, planners, and researchers. However, reproducible benchmarks with sufficient spatiotemporal depth and contextual richness for long horizon prediction remain scarce. To address this, we introduce HouseTS a large scale, multimodal dataset covering monthly house prices from March 2012 to December 2023 across 6,000 ZIP codes in 30 major U.S. metropolitan areas. The dataset includes over 890K records, enriched with points of Interest (POI), socioeconomic indicators, and detailed real estate metrics. To establish standardized performance baselines, we evaluate 14 models, spanning classical statistical approaches, deep neural networks (DNNs), and pretrained time-series foundation models. We further demonstrate the value of HouseTS in a multimodal case study, where a vision language model extracts structured textual descriptions of geographic change from time stamped satellite imagery. This enables interpretable, grounded insights into urban evolution. HouseTS is hosted on Kaggle, while all preprocessing pipelines, benchmark code, and documentation are openly maintained on GitHub to ensure full reproducibility and easy adoption.