A high-resolution nationwide urban village mapping product for 342 Chinese cities based on foundation models

📄 arXiv: 2602.18765v1 📥 PDF

作者: Lubin Bai, Sheng Xiao, Ziyu Yin, Haoyu Wang, Siyang Wu, Xiuyuan Zhang, Shihong Du

分类: cs.CV

发布日期: 2026-02-21

备注: Submitted to Earth System Science Data


💡 一句话要点

提出GeoLink-UV,基于基础模型构建中国342个城市高分辨率城中村地图产品。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 城中村识别 遥感影像 地理空间数据 基础模型 城市规划 非正式住区 可持续发展

📋 核心要点

  1. 现有城中村识别方法难以应对中国各地城中村的异质性和多样性,缺乏全国范围的可靠数据集。
  2. 论文提出一种基于基础模型驱动的映射框架,利用多源地理空间数据,提高城中村识别的泛化能力和产品质量。
  3. 通过对28个城市独立样本的地理分层精度评估,验证了GeoLink-UV数据集在异构城市环境中的可靠性和科学性。

📝 摘要(中文)

城中村(UVs)是中国快速城市化进程中一种独特的高密度非正式住区形式。准确识别城中村对于城市治理、更新和可持续发展至关重要。然而,由于中国幅员辽阔,城中村的异质性和多样性显著,因此一直缺乏一致且可靠的全国性数据集。本文提出了GeoLink-UV,这是一个高分辨率的全国性城中村地图产品,清晰地描绘了中国342个城市中城中村的位置和边界。该数据集来源于多源地理空间数据,包括光学遥感图像和地理矢量数据,并通过基础模型驱动的映射框架生成,旨在解决泛化问题并提高产品质量。基于来自28个城市的独立样本进行的地理分层精度评估证实了该全国性数据集在异构城市环境中的可靠性和科学可信度。基于该全国性产品,我们揭示了城中村的普遍性和空间配置方面的显着区域差异。平均而言,城中村面积占建成区的8%,在中部和南部地区呈现明显的聚集。建筑层面的分析进一步证实了全国城中村一致的低层、高密度发展模式,同时突出了区域差异化的形态特征。GeoLink-UV数据集为城市研究、非正式住区监测和循证城市更新规划提供了一个开放且经过系统验证的地理空间基础,并直接有助于与可持续发展目标11相一致的大规模评估。本文介绍的GeoLink-UV数据集可在https://doi.org/10.5281/zenodo.18688062免费获取。

🔬 方法详解

问题定义:论文旨在解决中国缺乏全国范围内一致且可靠的城中村(UVs)数据集的问题。现有方法难以应对中国各地城中村的异质性和多样性,导致识别精度和泛化能力不足。这阻碍了城市治理、更新和可持续发展相关研究和规划的开展。

核心思路:论文的核心思路是利用基础模型驱动的映射框架,结合多源地理空间数据(包括光学遥感图像和地理矢量数据),来提高城中村识别的泛化能力和产品质量。通过训练一个能够理解和识别不同类型城中村的基础模型,可以克服区域差异带来的挑战。

技术框架:GeoLink-UV的整体框架包含以下几个主要阶段:1) 数据收集与预处理:收集光学遥感图像和地理矢量数据,并进行清洗、校正和配准等预处理操作。2) 基础模型训练:使用大规模的城中村标注数据训练一个基础模型,使其能够学习城中村的通用特征。3) 城中村识别与边界提取:利用训练好的基础模型,对全国342个城市的遥感图像进行城中村识别,并提取城中村的边界。4) 精度评估与验证:通过地理分层抽样,选取28个城市的独立样本进行精度评估,验证数据集的可靠性和科学性。

关键创新:该论文最重要的技术创新点在于采用了基础模型驱动的映射框架。与传统的基于规则或人工特征的方法相比,基础模型能够自动学习城中村的复杂特征,从而提高识别精度和泛化能力。此外,该框架还结合了多源地理空间数据,进一步提升了识别的准确性。

关键设计:论文中关于基础模型的具体参数设置、损失函数和网络结构等技术细节没有详细描述,属于未知信息。但可以推测,模型可能采用了深度学习中的卷积神经网络(CNN)或Transformer等结构,并使用了针对遥感图像和地理矢量数据的特定损失函数。

📊 实验亮点

GeoLink-UV数据集覆盖中国342个城市,提供了高分辨率的城中村地图。通过对28个城市独立样本的地理分层精度评估,验证了数据集的可靠性和科学性。研究还揭示了中国城中村在区域分布和空间形态上的差异,为相关研究提供了重要参考。

🎯 应用场景

该研究成果可广泛应用于城市规划、土地利用、环境监测、社会经济研究等领域。GeoLink-UV数据集为城市更新、非正式住区治理、可持续发展目标评估等提供了重要的地理空间基础,有助于制定更科学合理的城市发展政策。

📄 摘要(原文)

Urban Villages (UVs) represent a distinctive form of high-density informal settlement embedded within China's rapidly urbanizing cities. Accurate identification of UVs is critical for urban governance, renewal, and sustainable development. But due to the pronounced heterogeneity and diversity of UVs across China's vast territory, a consistent and reliable nationwide dataset has been lacking. In this work, we present GeoLink-UV, a high-resolution nationwide UV mapping product that clearly delineates the locations and boundaries of UVs in 342 Chinese cities. The dataset is derived from multisource geospatial data, including optical remote sensing images and geo-vector data, and is generated through a foundation model-driven mapping framework designed to address the generalization issues and improve the product quality. A geographically stratified accuracy assessment based on independent samples from 28 cities confirms the reliability and scientific credibility of the nationwide dataset across heterogeneous urban contexts. Based on this nationwide product, we reveal substantial interregional disparities in UV prevalence and spatial configuration. On average, UV areas account for 8 % of built-up land, with marked clustering in central and south China. Building-level analysis further confirms a consistent low-rise, high-density development pattern of UVs nationwide, while highlighting regionally differentiated morphological characteristics. The GeoLink-UV dataset provides an open and systematically validated geospatial foundation for urban studies, informal settlement monitoring, and evidence-based urban renewal planning, and contributes directly to large-scale assessments aligned with Sustainable Development Goal 11. The GeoLink-UV dataset introduced in this article is freely available at https://doi.org/10.5281/zenodo.18688062.