GeoNDC: A Queryable Neural Data Cube for Planetary-Scale Earth Observation
作者: Jianbo Qi, Mengyao Li, Baogui Jiang, Yidan Chen, Qiao Wang
分类: cs.CV, physics.geo-ph
发布日期: 2026-03-26
备注: 22 pages, 7 figures
💡 一句话要点
GeoNDC:一种可查询的行星尺度地球观测神经数据立方体
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 地球观测 神经数据立方体 隐式神经场 时空数据 数据压缩
📋 核心要点
- 现有地球观测数据以离散栅格文件存储,导致存储成本高、传输效率低、查询困难。
- GeoNDC将地球观测数据编码为连续时空隐式神经场,实现按需查询和连续时间重建。
- 实验表明,GeoNDC在压缩率、查询效率和重建精度方面均优于传统方法。
📝 摘要(中文)
卫星地球观测积累了海量的时空档案,对于监测环境变化至关重要。然而,这些数据仍然以离散的栅格文件形式组织,导致存储、传输和查询成本高昂。我们提出了GeoNDC,一种可查询的神经数据立方体,它将行星尺度的地球观测数据编码为连续的时空隐式神经场,无需完全解压缩即可实现按需查询和连续时间重建。在20年的全球MODIS MCD43A4反射率记录(7个波段,5公里,8天采样)上的实验表明,学习到的表示支持在消费级硬件上进行直接的时空查询。在Sentinel-2影像(10米)上,连续时间参数化在高保真度(R² > 0.85)下恢复了模拟2公里云层遮挡下的无云动态。在HiGLASS生物物理产品(LAI和FPAR)上,GeoNDC获得了接近完美的精度(R² > 0.98)。该表示将20年的MODIS档案压缩到0.44 GB,相对于优化的Int16基线,压缩率约为95:1,并具有高光谱保真度(平均R² > 0.98,平均RMSE = 0.021)。这些结果表明,GeoNDC为行星尺度的地球观测提供了一种统一的AI原生表示,通过在单个框架中集成查询、重建和压缩,用一个紧凑的、分析就绪的数据层来补充原始档案。
🔬 方法详解
问题定义:现有地球观测数据以离散栅格文件形式存储,导致存储空间占用大,数据传输慢,且难以进行灵活的时空查询。传统方法难以兼顾存储效率、查询效率和数据精度。
核心思路:GeoNDC的核心思路是将离散的地球观测数据表示为一个连续的时空隐式神经场。通过训练一个神经网络来学习该场的参数,从而可以用神经网络来表示整个数据集。这样,可以通过输入时空坐标来查询对应的数据值,实现按需查询和连续时间重建。
技术框架:GeoNDC的技术框架主要包括数据编码和数据查询两个阶段。在数据编码阶段,首先将原始的地球观测数据进行预处理,然后将其输入到神经网络中进行训练,得到隐式神经场的参数。在数据查询阶段,用户输入时空坐标,神经网络根据学习到的参数输出对应的数据值。整体流程是将原始数据转化为神经网络参数,然后通过神经网络进行查询和重建。
关键创新:GeoNDC的关键创新在于使用隐式神经场来表示地球观测数据。与传统的离散栅格文件存储方式相比,隐式神经场可以实现更高的压缩率和更灵活的查询方式。此外,GeoNDC还可以实现连续时间重建,从而可以恢复被云层遮挡的数据。
关键设计:GeoNDC的关键设计包括神经网络的结构、损失函数和训练策略。神经网络通常采用多层感知机(MLP)结构,输入为时空坐标,输出为数据值。损失函数通常采用均方误差(MSE),用于衡量神经网络的输出与真实值之间的差异。训练策略通常采用随机梯度下降(SGD)算法,用于优化神经网络的参数。
🖼️ 关键图片
📊 实验亮点
GeoNDC在MODIS数据上实现了95:1的压缩率,同时保持了高光谱保真度(平均R² > 0.98,平均RMSE = 0.021)。在Sentinel-2数据上,GeoNDC能够以高保真度(R² > 0.85)恢复云层遮挡下的无云动态。在HiGLASS数据上,GeoNDC获得了接近完美的精度(R² > 0.98)。这些结果表明,GeoNDC在压缩率、重建精度和查询效率方面均优于传统方法。
🎯 应用场景
GeoNDC可应用于各种地球观测数据的存储、查询和分析,例如环境监测、气候变化研究、农业估产、灾害评估等。它能够提供更高效的数据访问和分析能力,支持更精细的时空分析,并促进地球科学研究的进展。未来,GeoNDC有望成为行星尺度地球观测数据管理和分析的重要基础设施。
📄 摘要(原文)
Satellite Earth observation has accumulated massive spatiotemporal archives essential for monitoring environmental change, yet these remain organized as discrete raster files, making them costly to store, transmit, and query. We present GeoNDC, a queryable neural data cube that encodes planetary-scale Earth observation data as a continuous spatiotemporal implicit neural field, enabling on-demand queries and continuous-time reconstruction without full decompression. Experiments on a 20-year global MODIS MCD43A4 reflectance record (7 bands, 5\,km, 8-day sampling) show that the learned representation supports direct spatiotemporal queries on consumer hardware. On Sentinel-2 imagery (10\,m), continuous temporal parameterization recovers cloud-free dynamics with high fidelity ($R^2 > 0.85$) under simulated 2-km cloud occlusion. On HiGLASS biophysical products (LAI and FPAR), GeoNDC attains near-perfect accuracy ($R^2 > 0.98$). The representation compresses the 20-year MODIS archive to 0.44\,GB -- approximately 95:1 relative to an optimized Int16 baseline -- with high spectral fidelity (mean $R^2 > 0.98$, mean RMSE $= 0.021$). These results suggest GeoNDC offers a unified AI-native representation for planetary-scale Earth observation, complementing raw archives with a compact, analysis-ready data layer integrating query, reconstruction, and compression in a single framework.