Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

📄 arXiv: 2603.09974v1 📥 PDF

作者: Aleksei Rozanov, Arvind Renganathan, Vipin Kumar

分类: cs.LG, physics.ao-ph

发布日期: 2026-03-10

备注: Accepted to the KGML Bridge at AAAI 2026 (non-archival)


💡 一句话要点

提出TAM-RL框架,利用表征学习提升陆地碳通量估算的准确性和泛化性

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 碳通量估算 表征学习 时空建模 物理约束 深度学习

📋 核心要点

  1. 现有碳通量估算方法难以泛化到观测区域外,导致预测偏差和不确定性。
  2. TAM-RL框架结合时空表征学习、知识引导架构和碳平衡损失函数,提升模型泛化能力。
  3. 实验表明,TAM-RL在多种生物群落中显著降低RMSE,并提升了解释方差。

📝 摘要(中文)

精确地提升陆地碳通量的尺度对于估算全球碳预算至关重要,但由于地面测量的稀疏性和区域偏差分布,这仍然具有挑战性。现有的数据驱动的尺度提升产品通常无法推广到观测域之外,导致系统的区域偏差和较高的预测不确定性。我们引入了任务感知调制与表征学习(TAM-RL)框架,该框架将时空表征学习与知识引导的编码器-解码器架构以及从碳平衡方程导出的损失函数相结合。在代表不同生物群落和气候类型的150多个通量塔站点上,TAM-RL相对于现有的最先进数据集提高了预测性能,降低了8-9.6%的RMSE,并将解释方差($R^2$)从19.4%提高到43.8%,具体取决于目标通量。这些结果表明,将物理约束与自适应表征学习相结合可以显著提高全球碳通量估计的鲁棒性和可迁移性。

🔬 方法详解

问题定义:论文旨在解决陆地碳通量尺度提升问题,即利用稀疏的地面测量数据,估算更大范围的碳通量。现有方法的痛点在于泛化能力不足,难以在未观测区域进行准确预测,导致区域偏差和高预测不确定性。

核心思路:论文的核心思路是将时空表征学习与物理知识相结合,利用碳平衡方程作为约束,引导模型学习更鲁棒、更具物理意义的表征。通过任务感知的调制机制,使模型能够根据不同的碳通量类型进行自适应调整。

技术框架:TAM-RL框架采用编码器-解码器架构。编码器负责学习输入数据的时空表征,解码器利用这些表征预测碳通量。框架的关键在于:1) 使用表征学习模块提取时空特征;2) 采用知识引导的架构,将碳平衡方程融入模型设计;3) 设计任务感知的调制机制,使模型能够针对不同的碳通量类型进行优化。

关键创新:最重要的技术创新点在于将物理知识(碳平衡方程)显式地融入到深度学习模型中。这与传统的纯数据驱动方法不同,能够提高模型的泛化能力和物理一致性。此外,任务感知的调制机制允许模型根据不同的碳通量类型进行自适应调整,进一步提升了预测精度。

关键设计:论文使用特定的损失函数,该损失函数基于碳平衡方程,鼓励模型预测的碳通量满足物理约束。编码器和解码器采用卷积神经网络或循环神经网络等结构,具体选择取决于输入数据的特性。任务感知的调制机制可能涉及注意力机制或条件归一化等技术,以实现对不同碳通量类型的自适应调整。具体的参数设置和网络结构细节在论文中应该有更详细的描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

TAM-RL框架在150多个通量塔站点上进行了验证,结果表明,相对于现有最先进的数据集,TAM-RL显著提高了预测性能,RMSE降低了8-9.6%,解释方差($R^2$)从19.4%提高到43.8%。这些结果表明,将物理约束与自适应表征学习相结合可以显著提高全球碳通量估计的鲁棒性和可迁移性。

🎯 应用场景

该研究成果可应用于全球碳循环建模、气候变化评估和土地管理等领域。更准确的碳通量估算有助于提高气候模型的预测精度,为制定更有效的减排政策提供科学依据。此外,该方法还可以用于评估不同土地利用方式对碳循环的影响,为可持续土地管理提供决策支持。

📄 摘要(原文)

Accurately upscaling terrestrial carbon fluxes is central to estimating the global carbon budget, yet remains challenging due to the sparse and regionally biased distribution of ground measurements. Existing data-driven upscaling products often fail to generalize beyond observed domains, leading to systematic regional biases and high predictive uncertainty. We introduce Task-Aware Modulation with Representation Learning (TAM-RL), a framework that couples spatio-temporal representation learning with knowledge-guided encoder-decoder architecture and loss function derived from the carbon balance equation. Across 150+ flux tower sites representing diverse biomes and climate regimes, TAM-RL improves predictive performance relative to existing state-of-the-art datasets, reducing RMSE by 8-9.6% and increasing explained variance ($R^2$) from 19.4% to 43.8%, depending on the target flux. These results demonstrate that integrating physically grounded constraints with adaptive representation learning can substantially enhance the robustness and transferability of global carbon flux estimates.