Scalable physical source-to-field inference with hypernetworks

📄 arXiv: 2405.05981v2 📥 PDF

作者: Berian James, Stefan Pollok, Ignacio Peis, Elizabeth Louise Baker, Jes Frellsen, Rasmus Bjørk

分类: cs.LG, cs.CE, physics.comp-ph

发布日期: 2024-05-07 (更新: 2026-02-04)

备注: Version accepted at TMLR


💡 一句话要点

提出一种可扩展的超网络模型以解决源到场的推断问题

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 超网络 物理模拟 源到场推断 计算复杂度 生成模型 隐式表示 复杂几何

📋 核心要点

  1. 现有方法在计算源周围场和势时,面临高计算复杂度和固定评估网格的限制。
  2. 本文提出的超网络架构能够生成源集合周围场的隐式表示,从而降低计算复杂度。
  3. 实验结果表明,该模型在相对误差和计算效率上均优于现有模型,适用于复杂场景的模拟。

📝 摘要(中文)

本文提出了一种生成模型,通过超网络实现对重力或电磁源周围场和势的推断,显著降低了计算复杂度。现有方法的计算复杂度为$ ext{O}(M imes N)$,而我们的方法则为$ ext{O}(M + N)$,相对误差约为4%-6%。该模型支持在任意位置对任意数量的源进行评估,极大提升了物理模拟的速度。我们还通过二维示例展示了模型在源重叠或复杂几何情况下的应用效果。

🔬 方法详解

问题定义:本文旨在解决在重力或电磁源周围进行场和势的推断时,现有方法面临的高计算复杂度和固定评估网格的限制。现有方法的计算复杂度为$ ext{O}(M imes N)$,在源数量和评估点数量增加时,计算成本显著上升。

核心思路:我们提出了一种超网络架构,该架构能够生成源集合周围场的隐式表示,从而将计算复杂度降低至$ ext{O}(M + N)$。这种设计使得模型能够在任意位置对任意数量的源进行高效评估,避免了固定网格的限制。

技术框架:整体架构包括超网络生成器和场评估模块。超网络生成器负责生成源周围场的隐式表示,而场评估模块则根据生成的表示进行快速计算。模型的输入为源的参数,输出为场的值。

关键创新:最重要的技术创新在于超网络的应用,使得模型能够在计算效率和灵活性上超越传统方法。与现有方法相比,我们的模型在处理复杂几何和源重叠的情况下表现出更好的适应性。

关键设计:模型的关键设计包括超网络的架构选择、损失函数的定义以及训练过程中参数的优化。我们采用了适应性学习率和正则化技术,以提高模型的泛化能力和稳定性。通过这些设计,模型能够在不同场景下保持较低的相对误差。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,提出的模型在相对误差上达到了4%-6%,计算复杂度显著降低至$ ext{O}(M + N)$。与现有模型相比,该方法在处理源重叠和复杂几何情况下的表现更为优越,展示了其在物理模拟中的广泛应用潜力。

🎯 应用场景

该研究的潜在应用领域包括物理模拟、工程设计和环境监测等。通过提高源到场推断的效率,该模型能够加速复杂系统的模拟过程,降低计算资源的消耗,具有重要的实际价值和未来影响。

📄 摘要(原文)

We present a generative model that amortises computation for the field and potential around e.g.~gravitational or electromagnetic sources. Exact numerical calculation has either computational complexity $\mathcal{O}(M\times{}N)$ in the number of sources $M$ and evaluation points $N$, or requires a fixed evaluation grid to exploit fast Fourier transforms. Using an architecture where a hypernetwork produces an implicit representation of the field or potential around a source collection, our model instead performs as $\mathcal{O}(M + N)$, achieves relative error of $\sim!4\%-6\%$, and allows evaluation at arbitrary locations for arbitrary numbers of sources, greatly increasing the speed of e.g.~physics simulations. We compare with existing models and develop two-dimensional examples, including cases where sources overlap or have more complex geometries, to demonstrate its application.