Physics-Based Flow Matching for Full-Field Prediction of Silicon Photonic Devices
作者: Joseph Quaratiello, Anthony Rizzo
分类: physics.optics, cs.LG
发布日期: 2026-05-07
备注: 11 pages, 4 figures
💡 一句话要点
提出PIC-Flow生成式神经代理模型,通过物理约束流匹配实现硅光子器件全场电磁场预测。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 生成式人工智能 流匹配 硅光子学 物理约束机器学习 神经代理模型 电磁场仿真
📋 核心要点
- 针对光子器件设计中FDTD仿真计算开销巨大、迭代周期长的核心痛点,寻求高效的神经代理模型替代方案。
- 提出PIC-Flow框架,利用条件流匹配技术学习噪声到电磁场的映射,并引入亥姆霍兹方程作为物理约束。
- 实验表明模型不仅在训练器件类上表现优异,且在S弯等未见器件类上展现出良好的泛化能力,显著提升设计效率。
📝 摘要(中文)
光子集成电路的设计依赖于精确的电磁场仿真,但即使对于简单的器件几何结构,传统的有限差分时域(FDTD)方法计算成本依然高昂。本文提出了PIC-Flow,这是一种生成式神经代理模型,旨在根据器件几何结构和工作波长预测电磁场分布,作为昂贵FDTD仿真的替代方案。该方法结合了三个核心思想:(i) 以条件流匹配作为生成框架,学习将高斯噪声转化为物理有效场解的速度场;(ii) 采用在实部和虚部场通道上运行的实值U-Net架构;(iii) 通过亥姆霍兹残差损失进行物理约束训练,强制满足波动方程。此外,我们引入了一种接口感知掩码方案,排除了介电边界处有限差分模板误差较大的像素,从而获得了更具物理意义的合规性指标。实验基于22,500个FDTD仿真数据,涵盖了多模干涉仪、Y分支和定向耦合器,并验证了模型在S弯、锥形波导等未见器件类上的泛化能力。
🔬 方法详解
问题定义:光子集成电路设计中,精确的电磁场模拟(如FDTD)计算复杂度高,难以支持大规模、快速的设计空间探索。现有代理模型往往难以同时兼顾预测精度与物理一致性。
核心思路:利用生成式流匹配(Flow Matching)框架,将电磁场预测建模为从高斯噪声到目标场分布的概率路径,并通过物理方程(亥姆霍兹方程)作为正则化项,确保生成的场分布符合麦克斯韦方程组的物理规律。
技术框架:整体采用条件流匹配架构,以器件几何结构和波长作为条件输入。网络主体为实值U-Net,分别处理电磁场的实部和虚部通道,通过学习速度场(Velocity Field)实现从噪声分布到物理场分布的确定性映射。
关键创新:引入了接口感知掩码(Interface-aware Masking)机制,在计算亥姆霍兹残差时,自动屏蔽介电常数突变边界处的像素,有效规避了有限差分模板在边界处的高误差,提升了物理约束的鲁棒性。
关键设计:损失函数由流匹配损失与亥姆霍兹残差损失加权构成,强制模型在预测过程中不仅拟合数据分布,还必须满足波动方程 $ abla^2 E_z + k_0^2 \varepsilon E_z = 0$ 的物理约束,确保预测结果的物理有效性。
🖼️ 关键图片
📊 实验亮点
模型在包含22,500个样本的数据集上进行了训练与验证,涵盖多种基础光子器件。实验结果表明,PIC-Flow不仅在测试集上实现了高精度的场分布预测,更重要的是展现了强大的零样本泛化能力,能够准确预测S-bends、tapers等训练集中未包含的复杂器件结构,验证了其作为通用光子设计辅助工具的潜力。
🎯 应用场景
该研究主要应用于光子集成电路(PIC)的快速设计与优化。通过提供毫秒级的电磁场预测,它能够显著加速复杂光子器件(如耦合器、干涉仪、波导结构)的设计空间探索,降低研发成本,并为大规模光子芯片的自动化布局布线提供高效的仿真工具支持。
📄 摘要(原文)
Designing photonic integrated circuits requires accurate electromagnetic field simulations, which remain computationally expensive even for simple device geometries. We present PIC-Flow, a generative neural surrogate that predicts electromagnetic field distributions for photonic devices given their geometry and operating wavelength as an alternative to costly finite-difference time-domain (FDTD) simulations. Our approach combines three key ideas: (i) conditional flow matching as the generative framework, learning a velocity field that transports Gaussian noise to physically valid field solutions; (ii) a real-valued U-Net operating on split real and imaginary field channels; and (iii) physics-constrained training through a Helmholtz residual loss enforcing $\nabla^2 E_z + k_0^2 \varepsilon E_z = 0$. We introduce an interface-aware masking scheme for the Helmholtz residual that excludes dielectric boundary pixels where finite-difference stencil errors dominate, yielding a physically meaningful compliance metric. The data set consists of 22,500 ground-truth FDTD simulations split evenly between multimode interferometers, Y-branches, and directional couplers at $λ=1.55\,μ$m in an 80/10/10 split between training, validation, and test sets. We evaluate ablations on the network against the held out test devices and also show that the model generalizes to held out device classes such as S-bends, tapers, and cascaded Y-branches. Rather than a drop-in replacement for FDTD, this work establishes a foundation that, with broader data coverage, more compute, and further training optimization, could scale toward broadband, device-agnostic field prediction with dramatically improved runtime for rapid design-space exploration of complex photonic devices and circuits.