KISS - Knowledge Infrastructure for Scientific Simulation: A Scaffolding for Agentic Earth Science

📄 arXiv: 2605.17856v1 📥 PDF

作者: Ziwei Li, Liujun Zhu, Yuchen Liu, Yichen Zhao, Birk Li, Ruiqi Wu, Junliang Jin, Jianyun Zhang

分类: cs.AI

发布日期: 2026-05-18


💡 一句话要点

提出KISS知识基础设施,赋能Agent自主执行地球科学模拟。

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion)

关键词: 知识基础设施 地球科学模拟 Agent 过程驱动模型 知识提取

📋 核心要点

  1. 现有过程驱动的地球科学模拟模型难以被气候风险高发和资源稀缺社区所用。
  2. 论文提出知识基础设施(KI),将领域知识外化为Agent可执行的建模算子和协议。
  3. 实验表明,配备KI的Agent在模拟任务中显著优于未配备KI的Agent,且KI具有跨学科通用性。

📝 摘要(中文)

本文提出了一种名为知识基础设施(KI)的Agent可执行框架,旨在将地球科学领域数十年的科学理解转化为可验证的建模算子、分阶段的领域协议和诊断恢复机制。通过KI,非专业用户也能使用过程驱动的模拟模型。在3000次耦合水文基准测试中,配备KI的Agent在高达84%的试验中产生了物理上合理且可验证的端到端模拟,而没有KI的Agent则停留在40%以下。KI具有跨学科的通用性,作者将其构建过程封装到知识剖析工具包(KDT)中,该工具包自主生成KI,使Agent能够端到端执行14个地球科学领域的117个额外的过程驱动模型。结果表明,尽管底层物理原理不同,建模决策和故障补救措施趋于收敛,表明操作专业知识是结构化的且可提取的。演示表明,配备KI的Agent降低了非专业用户与过程驱动模拟之间的访问壁垒,以及建模社区之间的集成壁垒。

🔬 方法详解

问题定义:现有过程驱动的地球科学模拟模型蕴含着丰富的领域知识,但由于其复杂性和专业性,使得非专业人士难以使用,尤其是在那些最容易受到气候风险和资源短缺影响的社区。现有方法缺乏将领域知识有效转化为Agent可执行操作的机制,导致模拟结果的可靠性和可验证性不足。

核心思路:论文的核心思路是将领域专家的知识显式地提取并结构化为知识基础设施(KI),该基础设施包含建模算子、领域协议和诊断恢复机制。通过KI,Agent可以自主地执行复杂的地球科学模拟,而无需人工干预。这种方法旨在降低模拟的门槛,并提高模拟结果的可信度。

技术框架:KI的技术框架主要包含以下几个模块:1) 建模算子:将领域知识封装为可执行的算子,例如水文模型中的降雨径流计算。2) 领域协议:定义模拟的执行流程和约束条件,例如模拟的时间步长和空间分辨率。3) 诊断恢复机制:当模拟出现错误时,提供诊断信息和修复建议,例如检查输入数据是否合理。论文还提出了知识剖析工具包(KDT),用于自动构建KI。KDT通过分析领域知识库和专家经验,自动提取建模算子、领域协议和诊断恢复机制。

关键创新:论文的关键创新在于提出了知识基础设施(KI)的概念,并将其应用于地球科学模拟领域。KI将领域知识显式地表示为Agent可执行的操作,从而降低了模拟的门槛,并提高了模拟结果的可信度。此外,知识剖析工具包(KDT)的提出,使得KI的构建过程自动化,大大提高了KI的可用性。

关键设计:KDT的设计是关键。它需要能够自动从各种来源(例如,科学文献、模型代码、专家访谈)提取知识,并将其转换为KI中的建模算子、领域协议和诊断恢复机制。具体的实现细节,例如知识表示方法、推理算法和错误检测机制,在论文中没有详细描述,属于未知内容。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在耦合水文基准测试中,配备KI的Agent在高达84%的试验中产生了物理上合理且可验证的端到端模拟,而没有KI的Agent则停留在40%以下。此外,知识剖析工具包(KDT)成功地为14个地球科学领域的117个过程驱动模型构建了KI,证明了KI的跨学科通用性。

🎯 应用场景

该研究成果可应用于气候变化影响评估、水资源管理、自然灾害预警等领域。通过降低过程驱动模拟的门槛,可以赋能更多非专业人士参与到地球科学研究中,从而更好地应对气候变化和资源短缺等挑战。未来,该研究还可以推广到其他科学领域,例如生物学、化学和材料科学。

📄 摘要(原文)

Process-based simulation models encode decades of scientific understanding across the Earth sciences, yet the communities most exposed to climate risk and resource scarcity are the least able to use them. Here, we introduce knowledge infrastructure (KI), an agent-actionable scaffold that externalizes expertise into validated modelling operators, staged domain protocols, and diagnostic recovery mechanisms. Across a 3,000-trial coupled-hydrology benchmark, agents equipped with KI produced physically plausible, verifiable end-to-end simulations in up to 84% of trials, while agents without KI plateaued below 40%. KI generalizes across disciplines. We packaged its construction into a Knowledge Dissection Toolkit (KDT) that autonomously produced KI enabling end-to-end agent execution of 117 additional process-based models across 14 Earth-science domains. Across all 119 KIs, modelling decisions and failure remedies converged despite different underlying physics, showing that operational expertise is structured and extractable rather than ad hoc. Demonstrations show KI-equipped agents lowering both the access barrier between non-specialist users and process-based simulation, and the integration barrier between modelling communities. Through this scaffold, process-based science can then evolve as a living scientific commons, answerable to whoever needs to know and extendable by whoever can contribute.