Rethinking Scientific Modeling: Toward Physically Consistent and Simulation-Executable Programmatic Generation

📄 arXiv: 2602.07083v1 📥 PDF

作者: Yongqing Jiang, Jianze Wang, Zhiqi Shen, Zhenghong Lin, Jiayuan Wang, Yijian Yang, Kaoshan Dai, Haoran Luo

分类: cs.SE, cs.AI

发布日期: 2026-02-06

🔗 代码/项目: GITHUB


💡 一句话要点

提出物理一致的程序化生成框架,用于自动创建可执行的结构建模代码。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 结构建模 代码生成 物理一致性 大型语言模型 约束推理 仿真验证 领域知识 自动建筑建模

📋 核心要点

  1. 现有方法在结构建模代码自动生成中,难以保证物理一致性和可执行性,导致下游仿真失效。
  2. 该论文提出一个物理一致的自动建筑建模框架,通过领域知识构建、约束对齐和验证驱动评估来解决。
  3. 实验结果表明,该方法在可执行性和结构动力学一致性方面,相较于基线方法有显著提升。

📝 摘要(中文)

结构建模是计算工程科学的基础组成部分,即使是微小的物理不一致或规范违规也可能导致下游仿真失效。大型语言模型(LLM)在自动生成建模代码方面的潜力已经得到证实。然而,在严格的工程约束下,不可执行或物理不一致的输出仍然普遍存在。因此,本文提出了一个物理一致的自动建筑建模框架,集成了领域知识构建、面向约束的模型对齐和验证驱动的评估。引入了CivilInstruct,这是一个特定领域的数据集,它形式化了结构工程知识和约束推理,以实现可用于仿真的模型生成。进一步采用了一种两阶段微调策略,以强制满足约束和应用程序编程接口的兼容性,从而大大减少了幻觉和不符合规范的输出。MBEval被提出作为一个验证驱动的基准,通过闭环验证来评估可执行性和结构动力学一致性。实验结果表明,在严格的验证指标下,相对于基线方法,该方法始终如一地有所改进。代码可在https://github.com/Jovanqing/AutoBM上获取。

🔬 方法详解

问题定义:论文旨在解决结构建模代码自动生成中物理一致性和可执行性难以保证的问题。现有方法,即使利用大型语言模型,仍然容易产生不符合物理规律或无法直接执行的代码,这严重影响了下游仿真的可靠性。现有方法缺乏对结构工程领域知识的有效整合和约束条件的严格执行,导致生成结果的质量难以保证。

核心思路:论文的核心思路是将领域知识、约束推理和验证评估融入到建模代码生成的过程中。通过构建领域知识库,对模型进行约束对齐,并采用验证驱动的评估方法,确保生成的代码在物理上是一致的,并且可以直接用于仿真。这种方法强调了从设计到验证的闭环反馈,从而提高了建模代码的质量和可靠性。

技术框架:该框架包含三个主要模块:领域知识构建、约束导向模型对齐和验证驱动评估。首先,构建CivilInstruct数据集,形式化结构工程知识和约束推理。然后,采用两阶段微调策略,使模型满足约束条件和API兼容性。最后,使用MBEval基准进行验证驱动的评估,通过闭环验证评估可执行性和结构动力学一致性。

关键创新:该论文的关键创新在于提出了一个完整的、物理一致的自动建筑建模框架,该框架集成了领域知识、约束推理和验证评估。与现有方法相比,该框架更加注重物理一致性和可执行性,通过闭环验证确保生成模型的质量。CivilInstruct数据集和MBEval基准的提出,为结构建模代码自动生成的研究提供了新的资源和评估标准。

关键设计:CivilInstruct数据集包含结构工程知识和约束推理的 formalization。两阶段微调策略包括:首先,对模型进行预训练,使其具备基本的建模能力;然后,针对约束条件和API兼容性进行微调,以减少幻觉和不符合规范的输出。MBEval基准通过闭环验证来评估可执行性和结构动力学一致性,包括检查代码是否可以成功执行,以及生成的模型是否符合结构动力学规律。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在MBEval基准测试中,相较于基线方法,在可执行性和结构动力学一致性方面均有显著提升。通过两阶段微调策略,有效减少了幻觉和不符合规范的输出,使得生成的模型更加可靠和实用。具体性能数据和提升幅度在论文中有详细展示。

🎯 应用场景

该研究成果可应用于建筑设计、土木工程、结构分析等领域,能够自动生成符合物理规律且可执行的结构模型代码,从而提高建模效率、降低建模成本,并减少人为错误。未来,该技术有望应用于更复杂的工程结构建模,并与其他AI技术相结合,实现智能化的结构设计和优化。

📄 摘要(原文)

Structural modeling is a fundamental component of computational engineering science, in which even minor physical inconsistencies or specification violations may invalidate downstream simulations. The potential of large language models (LLMs) for automatic generation of modeling code has been demonstrated. However, non-executable or physically inconsistent outputs remain prevalent under stringent engineering constraints. A framework for physics-consistent automatic building modeling is therefore proposed, integrating domain knowledge construction, constraint-oriented model alignment, and verification-driven evaluation. CivilInstruct is introduced as a domain-specific dataset that formalizes structural engineering knowledge and constraint reasoning to enable simulation-ready model generation. A two-stage fine-tuning strategy is further employed to enforce constraint satisfaction and application programming interface compliance, substantially reducing hallucinated and non-conforming outputs. MBEval is presented as a verification-driven benchmark that evaluates executability and structural dynamics consistency through closed-loop validation. Experimental results show consistent improvements over baselines across rigorous verification metrics. Our code is available at https://github.com/Jovanqing/AutoBM.