From Perception to Autonomous Computational Modeling: A Multi-Agent Approach

作者: Daniel N. Wilke

分类: cs.CE, cs.CL, cs.MA

发布日期: 2026-04-08

备注: 32 pages, 8 figures, 5 tables

💡 一句话要点

提出基于多智能体LLM的计算建模框架，实现从感知数据到自主工程报告的完整流程。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 计算力学 有限元分析 自动化建模 不确定性量化 工程报告生成

📋 核心要点

传统计算力学流程依赖人工干预，效率低且易出错，难以处理感知数据的不确定性。
利用多智能体LLM协同工作，构建从感知到报告的自主计算建模流程，解决人工建模的瓶颈。
实验证明，该框架能从L型支架照片自主完成有限元分析，并生成包含失效分析和重设计的报告。

📝 摘要（中文）

本文提出了一种与求解器无关的框架，其中协同的大型语言模型（LLM）智能体自主执行完整的计算力学工作流程，从工程组件的感知数据开始，经过几何提取、材料推断、离散化、求解器执行、不确定性量化和符合规范的评估，最终生成包含可行性建议的工程报告。智能体被形式化为共享上下文空间上的条件算子，质量门控引入了管道层之间的条件迭代。我们引入了一个数学框架，用于在不确定性下从感知数据中提取工程信息，使用区间边界、概率密度和模糊隶属函数，并引入任务相关的保守性来解决“保守”的歧义，因为不同的极限状态受相反的参数趋势控制。该框架通过应用于钢制L型支架照片的有限元分析管道进行演示，生成了一个包含171,504个节点的四面体网格，在三个边界条件假设下进行了七次分析，并进行了符合规范的评估，揭示了结构失效以及量化的重新设计。所有结果均以首次自主迭代生成，无需手动校正，强调专业工程师必须审查并签署任何此类分析。

🔬 方法详解

问题定义：传统计算力学工作流程高度依赖人工操作，包括几何建模、材料属性定义、网格划分、边界条件设置、求解器选择和结果分析等步骤。这些步骤不仅耗时，而且容易引入人为误差，尤其是在处理从感知数据（如图像）中提取的工程信息时，不确定性因素会进一步增加建模的复杂性。现有方法缺乏自动化和智能化，难以应对复杂工程问题的快速迭代和优化需求。

核心思路：本文的核心思路是利用大型语言模型（LLM）作为智能体，构建一个多智能体协同工作的框架，实现计算力学工作流程的自动化。每个智能体负责一个特定的任务，例如几何提取、材料推断、网格划分等，并通过共享的上下文空间进行信息交互和协作。通过引入质量门控机制，实现管道层之间的条件迭代，确保每个阶段的输出质量。

技术框架：该框架包含以下主要模块：1) 感知数据输入：接收工程组件的感知数据，如照片。2) 几何提取：利用LLM智能体从感知数据中提取几何信息。3) 材料推断：根据几何信息和先验知识，推断材料属性。4) 离散化：生成有限元网格。5) 求解器执行：选择合适的求解器进行计算。6) 不确定性量化：量化感知数据和模型参数的不确定性。7) 符合规范的评估：根据工程规范进行结构评估。8) 工程报告生成：生成包含可行性建议的工程报告。

关键创新：该框架的关键创新在于：1) 提出了一个与求解器无关的多智能体LLM协同框架，实现了计算力学工作流程的完全自动化。2) 引入了数学框架，用于在不确定性下从感知数据中提取工程信息，并使用区间边界、概率密度和模糊隶属函数来表示不确定性。3) 引入了任务相关的保守性概念，解决了在不同极限状态下“保守”的歧义。

关键设计：智能体被形式化为共享上下文空间上的条件算子，质量门控引入了管道层之间的条件迭代。框架使用区间边界、概率密度和模糊隶属函数来量化不确定性。任务相关的保守性通过调整参数来满足不同的极限状态要求。

🖼️ 关键图片

📊 实验亮点

通过对钢制L型支架照片进行有限元分析，该框架成功生成了一个包含171,504个节点的四面体网格，并在三个边界条件假设下进行了七次分析。结果表明，该框架能够自主完成结构失效分析，并提出量化的重新设计方案。所有结果均在首次自主迭代中生成，无需人工干预，验证了该框架的有效性和可靠性。

🎯 应用场景

该研究成果可应用于各种工程领域，例如结构设计、机械设计、航空航天等。通过自动化计算建模流程，可以显著提高工程设计的效率和质量，降低成本。此外，该框架还可以用于快速评估现有结构的安全性，并为结构改造提供可行性建议。未来，该技术有望与数字孪生技术结合，实现对物理结构的实时监测和预测。

📄 摘要（原文）

We present a solver-agnostic framework in which coordinated large language model (LLM) agents autonomously execute the complete computational mechanics workflow, from perceptual data of an engineering component through geometry extraction, material inference, discretisation, solver execution, uncertainty quantification, and code-compliant assessment, to an engineering report with actionable recommendations. Agents are formalised as conditioned operators on a shared context space with quality gates that introduce conditional iteration between pipeline layers. We introduce a mathematical framework for extracting engineering information from perceptual data under uncertainty using interval bounds, probability densities, and fuzzy membership functions, and introduce task-dependent conservatism to resolve the ambiguity of what `conservative' means when different limit states are governed by opposing parameter trends. The framework is demonstrated through a finite element analysis pipeline applied to a photograph of a steel L-bracket, producing a 171,504-node tetrahedral mesh, seven analyses across three boundary condition hypotheses, and a code-compliant assessment revealing structural failure with a quantified redesign. All results are presented as generated in the first autonomous iteration without manual correction, reinforcing that a professional engineer must review and sign off on any such analysis.

From Perception to Autonomous Computational Modeling: A Multi-Agent Approach

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理