FieldSeer I: Physics-Guided World Models for Long-Horizon Electromagnetic Dynamics under Partial Observability
作者: Ziheng Guo, Fang Wu, Maoxiong Zhao, Chaoqun Fang, Yang Bu
分类: physics.optics, cs.LG, physics.comp-ph
发布日期: 2025-12-05
💡 一句话要点
FieldSeer I:基于物理引导的世界模型,用于部分观测下长时程电磁动力学预测
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 世界模型 电磁动力学 物理引导 部分观测 长时程预测
📋 核心要点
- 现有方法难以在部分观测下准确预测电磁场长时程动态,尤其是在结构发生变化时。
- FieldSeer I通过结合物理知识和几何信息,构建世界模型,实现对电磁场动态的预测和编辑。
- 实验表明,FieldSeer I在多个实际场景中优于现有方法,并支持前缀后的几何修改。
📝 摘要(中文)
本文提出了FieldSeer I,一个几何感知的世界模型,用于预测二维TE波导中基于部分观测的电磁场动力学。该模型吸纳一段短期的观测场前缀,并以标量源作用和结构/材料图为条件,在物理域中生成闭环展开。在对称对数域中进行训练,确保数值稳定性。在可复现的FDTD基准测试(200个独特的模拟,结构分割)中评估,FieldSeer I在三种实际设置中实现了比GRU和确定性基线更高的后缀保真度:(i)软件在环滤波(64x64,P=80->Q=80),(ii)离线单文件展开(80x140,P=240->Q=40),以及(iii)离线多结构展开(80x140,P=180->Q=100)。至关重要的是,它支持在不重新同化的情况下进行前缀后的几何修改。结果表明,几何条件世界模型为光子设计的交互式数字孪生提供了一条切实可行的途径。
🔬 方法详解
问题定义:论文旨在解决在部分观测条件下,对二维TE波导中的电磁场动力学进行长时程预测的问题。现有方法,如传统的数值方法(如FDTD)计算量大,难以进行实时交互;而基于数据驱动的方法,如GRU等,在长时程预测中容易出现误差累积,且难以处理结构变化的情况。
核心思路:论文的核心思路是构建一个几何感知的世界模型,该模型能够学习电磁场的物理规律,并结合几何信息,实现对电磁场动态的准确预测。通过将物理知识融入到模型中,可以提高模型的泛化能力和鲁棒性,使其能够处理结构变化的情况。
技术框架:FieldSeer I的整体架构包含以下几个主要模块:1) 观测数据同化模块:用于将观测到的电磁场数据输入到模型中。2) 物理域预测模块:基于物理规律和几何信息,预测未来的电磁场动态。3) 闭环控制模块:根据预测结果,调整模型的参数,实现闭环控制。模型以标量源作用和结构/材料图为条件,在物理域中生成闭环展开。
关键创新:论文的关键创新在于将物理知识和几何信息融入到世界模型中。具体来说,模型利用了电磁场的物理规律,如麦克斯韦方程组,以及几何信息,如波导的形状和材料分布,来约束模型的预测结果。此外,模型还采用了对称对数域训练,以确保数值稳定性。
关键设计:FieldSeer I的关键设计包括:1) 使用卷积神经网络(CNN)来提取几何特征。2) 使用循环神经网络(RNN)来建模电磁场的时间动态。3) 使用物理损失函数来约束模型的预测结果,例如,麦克斯韦方程组的残差。4) 采用对称对数域进行训练,以避免数值不稳定问题。具体的参数设置和网络结构在论文中有详细描述。
📊 实验亮点
FieldSeer I在可复现的FDTD基准测试中表现出色,在软件在环滤波(64x64, P=80->Q=80)、离线单文件展开(80x140, P=240->Q=40)和离线多结构展开(80x140, P=180->Q=100)三个实际场景中,均实现了比GRU和确定性基线更高的后缀保真度。更重要的是,FieldSeer I支持在不重新同化的情况下进行前缀后的几何修改,这为交互式设计提供了便利。
🎯 应用场景
FieldSeer I具有广泛的应用前景,例如,可以用于光子器件的交互式设计。通过FieldSeer I,设计者可以快速地预测不同结构下的电磁场分布,并进行优化设计。此外,FieldSeer I还可以用于电磁场的实时监测和控制,例如,在无线通信系统中,可以利用FieldSeer I来预测信道的变化,并进行动态资源分配。该研究为交互式数字孪生提供了一条切实可行的途径,未来可能在光子学、微波工程等领域发挥重要作用。
📄 摘要(原文)
We introduce FieldSeer I, a geometry-aware world model that forecasts electromagnetic field dynamics from partial observations in 2-D TE waveguides. The model assimilates a short prefix of observed fields, conditions on a scalar source action and structure/material map, and generates closed-loop rollouts in the physical domain. Training in a symmetric-log domain ensures numerical stability. Evaluated on a reproducible FDTD benchmark (200 unique simulations, structure-wise split), FieldSeer I achieves higher suffix fidelity than GRU and deterministic baselines across three practical settings: (i) software-in-the-loop filtering (64x64, P=80->Q=80), (ii) offline single-file rollouts (80x140, P=240->Q=40), and (iii) offline multi-structure rollouts (80x140, P=180->Q=100). Crucially, it enables edit-after-prefix geometry modifications without re-assimilation. Results demonstrate that geometry-conditioned world models provide a practical path toward interactive digital twins for photonic design.