Chat to Chip: Large Language Model Based Design of Arbitrarily Shaped Metasurfaces

📄 arXiv: 2509.24196v2 📥 PDF

作者: Huanshu Zhang, Lei Kang, Sawyer D. Campbell, Douglas H. Werner

分类: physics.optics, cs.AI

发布日期: 2025-09-29 (更新: 2026-01-26)

DOI: 10.1515/nanoph-2025-0343


💡 一句话要点

提出基于大语言模型的超表面设计方法,实现任意形状超表面的光谱预测与逆向设计。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 超表面设计 大语言模型 逆向设计 纳米光子学 电磁建模

📋 核心要点

  1. 传统超表面设计依赖耗时的全波仿真,限制了复杂结构的设计探索和优化。
  2. 该论文提出利用大语言模型(LLM)学习超表面几何结构与光谱响应之间的物理关系,实现快速设计。
  3. 实验表明,经过微调的LLM能够有效预测任意形状超表面的光谱,并进行逆向设计。

📝 摘要(中文)

传统超表面设计受限于全波仿真的计算成本,难以充分探索复杂结构。数据驱动方法通过快速神经网络评估替代耗时仿真,实现近乎瞬时的超原子设计。然而,实现新的光学功能仍需构建和训练特定任务的网络,以及耗尽式搜索合适的架构和超参数。预训练大语言模型(LLM)通过简单的微调技术规避了这一繁琐过程。然而,将LLM应用于纳米光子器件设计,特别是任意形状超表面,仍处于早期阶段,因为此类任务通常需要图形网络。本文表明,输入任意形状超表面几何结构的描述性信息,LLM可以学习光谱预测和逆向设计所需的物理关系。进一步评估了一系列开放权重LLM,并确定了十亿参数级别上准确性与模型大小之间的关系。证明了一维token-wise LLM为设计二维任意形状超表面提供了一种实用的工具。将自然语言交互与电磁建模联系起来,这种“chat-to-chip”工作流程代表着朝着更友好的数据驱动纳米光子学迈出的一步。

🔬 方法详解

问题定义:传统超表面设计面临的主要问题是全波电磁仿真计算成本高昂,导致难以对复杂形状和结构的超表面进行高效的设计和优化。现有的数据驱动方法虽然可以加速设计过程,但通常需要针对特定光学功能训练专门的神经网络,这需要大量的数据和计算资源,并且泛化能力有限。

核心思路:该论文的核心思路是利用预训练的大语言模型(LLM)来学习超表面几何结构与光谱响应之间的物理关系。通过将超表面的几何形状描述作为LLM的输入,并将其光谱响应作为输出,LLM可以学习到从几何形状到光谱响应的映射关系,从而实现快速的光谱预测和逆向设计。这种方法避免了从头开始训练神经网络的需要,并且可以利用LLM强大的泛化能力来处理各种形状和结构的超表面。

技术框架:该论文提出的技术框架主要包括以下几个步骤:1)将超表面的几何形状进行编码,生成LLM可以理解的文本描述;2)使用预训练的LLM,并使用超表面数据集对其进行微调,使其能够学习超表面几何形状与光谱响应之间的关系;3)使用微调后的LLM进行光谱预测和逆向设计。在光谱预测中,LLM根据输入的几何形状描述预测超表面的光谱响应。在逆向设计中,LLM根据目标光谱响应生成超表面的几何形状描述。

关键创新:该论文最重要的技术创新点在于将大语言模型应用于超表面的设计。与传统的基于神经网络的方法相比,该方法不需要针对特定任务训练专门的网络,而是利用预训练的LLM的强大泛化能力,从而大大降低了设计成本和时间。此外,该论文还探索了使用一维token-wise LLM来设计二维任意形状超表面的方法,这进一步提高了设计的灵活性和效率。

关键设计:在几何形状编码方面,论文采用了一种描述性的文本输入方式,将超表面的形状、尺寸和材料等信息转化为LLM可以理解的文本序列。在模型训练方面,论文选择了一系列开放权重的LLM,并根据模型大小和性能进行了基准测试。损失函数方面,采用了均方误差(MSE)等常用的回归损失函数来衡量预测光谱与真实光谱之间的差异。网络结构方面,重点考察了不同参数规模的LLM对性能的影响。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该研究成功地将大语言模型应用于任意形状超表面的设计,并验证了其有效性。实验结果表明,经过微调的LLM能够准确预测超表面的光谱响应,并实现逆向设计。通过对比不同规模的LLM,发现模型大小与性能之间存在正相关关系。该方法为超表面设计提供了一种新的思路,并有望大大降低设计成本和时间。

🎯 应用场景

该研究成果可应用于各种光学器件的设计,例如滤波器、偏振片、透镜等。通过自然语言交互,用户可以方便地设计具有特定光学功能的超表面,加速新型光子器件的开发。该方法在生物传感、光通信、成像等领域具有广阔的应用前景,并有望推动纳米光子学的发展。

📄 摘要(原文)

Traditional metasurface design is limited by the computational cost of full-wave simulations, preventing thorough exploration of complex configurations. Data-driven approaches have emerged as a solution to this bottleneck, replacing costly simulations with rapid neural network evaluations and enabling near-instant design for meta-atoms. Despite advances, implementing a new optical function still requires building and training a task-specific network, along with exhaustive searches for suitable architectures and hyperparameters. Pre-trained large language models (LLMs), by contrast, sidestep this laborious process with a simple fine-tuning technique. However, applying LLMs to the design of nanophotonic devices, particularly for arbitrarily shaped metasurfaces, is still in its early stages; as such tasks often require graphical networks. Here, we show that an LLM, fed with descriptive inputs of arbitrarily shaped metasurface geometries, can learn the physical relationships needed for spectral prediction and inverse design. We further benchmarked a range of open-weight LLMs and identified relationships between accuracy and model size at the billion-parameter level. We demonstrated that 1-D token-wise LLMs provide a practical tool to designing 2-D arbitrarily shaped metasurfaces. Linking natural-language interaction to electromagnetic modelling, this "chat-to-chip" workflow represents a step toward more user-friendly data-driven nanophotonics.