PRISM: Position-encoded Regressive Inverse Spectral Model for Multilayer Thin-Film Design
作者: Runtian Wang, Renhao Xue, Baige Chen, Hao Wu
分类: cs.LG, physics.optics
发布日期: 2026-05-26
备注: 8 pages, 3 figures
💡 一句话要点
PRISM:用于多层薄膜设计的位移编码回归逆谱模型
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱七:动作重定向 (Motion Retargeting)
关键词: 多层薄膜设计 逆问题 Transformer 自回归模型 位置编码 光学涂层 材料设计
📋 核心要点
- 多层薄膜设计逆问题面临组合优化和连续优化的双重挑战,现有方法效率较低。
- PRISM采用decoder-only自回归Transformer,联合预测材料选择和厚度回归,实现端到端优化。
- 实验结果表明,PRISM在参数量更少的情况下,显著降低了平均绝对误差(MAE),并超越了模拟退火等传统方法。
📝 摘要(中文)
多层薄膜光学涂层设计的逆问题是一个复杂的组合-连续优化挑战。我们提出了PRISM(Position-encoded Regressive Inverse Spectral Model,位移编码回归逆谱模型),这是一个统一的仅解码器自回归Transformer,通过在单个骨干网络中联合预测离散材料选择和连续厚度回归来简化此过程。PRISM引入了两个主要的架构创新:(1)频谱前缀条件化,它利用标准前缀token进行上下文目标注入;(2)累积深度旋转位置嵌入,它将连续厚度直接编码到位置表示中,以保持堆叠的物理空间关系。我们的基准测试表明,PRISM-13M模型与其它Transformer基线相比,在仅使用五分之一参数的情况下,将MAE降低了50%以上。此外,一个44M参数的变体在我们的同分布验证基准上实现了最先进的性能(MAE = 0.010),并且运行速度明显快于模拟退火,为经典优化方法提供了一种高效的替代方案。
🔬 方法详解
问题定义:多层薄膜光学涂层设计是一个逆问题,目标是找到满足特定光谱响应的材料和厚度组合。传统方法,如模拟退火,计算成本高昂,且难以处理材料选择的离散性。现有基于Transformer的方法参数量大,效率较低。
核心思路:PRISM的核心在于使用一个decoder-only的自回归Transformer,将材料选择和厚度回归统一到一个模型中。通过频谱前缀条件化,模型可以根据目标光谱响应进行预测。累积深度旋转位置嵌入则用于编码连续的厚度信息,保持物理空间关系。
技术框架:PRISM模型主要包含以下几个部分:1) 输入层:将目标光谱作为前缀token输入;2) Transformer解码器:使用标准的Transformer解码器结构进行序列预测;3) 位置编码:使用累积深度旋转位置嵌入编码厚度信息;4) 输出层:预测材料类型和厚度。整个流程是自回归的,即每次预测一个材料和厚度,然后将其加入到输入序列中,用于下一步的预测。
关键创新:PRISM的关键创新在于:1) 频谱前缀条件化,允许模型根据目标光谱进行条件生成;2) 累积深度旋转位置嵌入,将连续的厚度信息编码到位置表示中,保留了物理空间关系。这与传统的位置编码方法不同,后者通常只编码离散的位置信息。
关键设计:频谱前缀条件化使用标准的前缀token,将目标光谱信息嵌入到输入序列中。累积深度旋转位置嵌入通过将厚度信息累积并应用旋转矩阵来实现位置编码。损失函数包括材料选择的交叉熵损失和厚度回归的L1损失。模型参数量有13M和44M两种变体。
🖼️ 关键图片
📊 实验亮点
PRISM-13M模型在多层薄膜设计任务中,相比其他Transformer基线,在仅使用五分之一参数的情况下,将平均绝对误差(MAE)降低了50%以上。PRISM-44M模型在同分布验证基准上实现了最先进的性能(MAE = 0.010),并且运行速度明显快于模拟退火。
🎯 应用场景
PRISM可应用于光学滤波器、反射镜、增透膜等多种薄膜器件的设计。该方法能够加速设计流程,降低研发成本,并有望发现性能更优异的新型薄膜结构。此外,该方法也可推广到其他材料设计领域,例如超材料和光子晶体。
📄 摘要(原文)
The inverse problem of multilayer thin-film optical coatings design represents a complex combinatorial-continuous optimization challenge. We present PRISM (Position-encoded Regressive Inverse Spectral Model), a unified decoder-only autoregressive transformer that streamlines this process by jointly predicting discrete material selection and continuous thickness regression within a single backbone. PRISM introduces two primary architectural innovations: (1) spectrum prefix conditioning, which utilizes standard prefix tokens for in-context target injection, and (2) cumulative-depth Rotary Position Embeddings, which encode continuous thickness directly into the positional representation to preserve the physical spatial relationships of the stack. Our benchmarks demonstrate that a PRISM-13M model reduces MAE by over 50\% compared to other transformer baselines while utilizing only one-fifth of the parameters. Furthermore, a 44M-parameter variant achieves state-of-the-art performance (MAE = 0.010) on our in-distribution validation benchmark and operates significantly faster than simulated annealing, offering a highly efficient alternative to classical optimization methods.