PhyNiKCE: A Neurosymbolic Agentic Framework for Autonomous Computational Fluid Dynamics
作者: E Fan, Lisong Shi, Zhengtong Li, Chih-yung Wen
分类: cs.AI, cs.CL
发布日期: 2026-02-12
备注: 30 pages, 10 figures
💡 一句话要点
PhyNiKCE:一种神经符号代理框架,用于自主计算流体动力学。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 计算流体动力学 神经符号AI 自主代理 约束满足问题 检索增强生成
📋 核心要点
- 现有CFD自主代理依赖LLM,但LLM的概率性导致难以保证物理守恒和数值稳定性,易受“上下文污染”影响。
- PhyNiKCE框架将神经规划与符号验证分离,利用符号知识引擎和确定性RAG引擎,强制执行物理约束,确保模拟的物理有效性。
- 实验表明,PhyNiKCE相比现有方法,性能提升96%,自校正循环减少59%,LLM token消耗降低17%,显著提升了CFD模拟的鲁棒性和效率。
📝 摘要(中文)
计算流体动力学(CFD)自主代理的部署受到大语言模型(LLM)概率性质的限制,它们难以执行物理模拟所需的严格守恒定律和数值稳定性。单纯依赖语义检索增强生成(RAG)常导致“上下文污染”,代理生成在语言上合理但物理上无效的配置,这是由于根本的语义-物理脱节。为弥合这一差距,本文提出了PhyNiKCE(物理和数值知识上下文工程),一种用于可信工程的神经符号代理框架。与标准黑盒代理不同,PhyNiKCE将神经规划与符号验证分离。它采用符号知识引擎,将模拟设置视为约束满足问题,通过具有针对求解器、湍流模型和边界条件的专门检索策略的确定性RAG引擎严格执行物理约束。通过在实际的、非教程CFD任务上使用Gemini-2.5-Pro/Flash进行的严格OpenFOAM实验验证,PhyNiKCE证明了相对于最先进基线96%的相对改进。此外,通过用知识驱动的初始化代替试错,该框架将自主自校正循环减少了59%,同时降低了LLM token消耗17%。这些结果表明,将神经生成与符号约束执行分离显著提高了鲁棒性和效率。虽然已在CFD上验证,但此架构为更广泛的工业自动化中的可信人工智能提供了一种可扩展、可审计的范例。
🔬 方法详解
问题定义:现有基于大语言模型的CFD自主代理,由于LLM本身的概率性,难以保证模拟结果满足严格的物理定律和数值稳定性要求。单纯依赖检索增强生成(RAG)容易引入“上下文污染”,导致代理生成在语言上合理但物理上不合理的配置,造成语义和物理的脱节。
核心思路:PhyNiKCE的核心思路是将神经规划与符号验证解耦。利用神经模型进行规划,生成可能的CFD配置,然后通过符号知识引擎对配置进行验证,确保其满足物理约束。这种解耦的设计避免了LLM直接生成物理上无效的配置,提高了模拟的可靠性。
技术框架:PhyNiKCE框架包含以下主要模块:1) 神经规划器:利用LLM进行CFD模拟方案的规划;2) 符号知识引擎:将模拟设置视为约束满足问题,存储物理定律和数值稳定性约束;3) 确定性RAG引擎:基于符号知识引擎,检索相关的求解器、湍流模型和边界条件等信息,并强制执行物理约束;4) OpenFOAM环境:执行CFD模拟并提供反馈。整体流程是神经规划器提出方案,符号知识引擎和确定性RAG引擎验证方案的物理有效性,最后在OpenFOAM环境中执行模拟。
关键创新:PhyNiKCE最重要的创新点在于神经规划与符号验证的解耦。传统方法依赖LLM直接生成CFD配置,容易出错。PhyNiKCE通过符号知识引擎和确定性RAG引擎,对LLM生成的配置进行物理约束验证,确保模拟的物理有效性。这种解耦的设计显著提高了模拟的鲁棒性和可靠性。
关键设计:PhyNiKCE的关键设计包括:1) 符号知识引擎的构建,需要将物理定律和数值稳定性约束形式化;2) 确定性RAG引擎的检索策略,需要针对求解器、湍流模型和边界条件等信息进行优化,确保检索结果的准确性和完整性;3) 神经规划器的prompt设计,需要引导LLM生成合理的CFD配置。
🖼️ 关键图片
📊 实验亮点
实验结果表明,PhyNiKCE框架在实际的CFD任务中取得了显著的性能提升。相对于最先进的基线方法,PhyNiKCE的性能提升了96%。同时,PhyNiKCE框架将自主自校正循环减少了59%,LLM token消耗降低了17%,表明该框架在提高效率的同时,也降低了计算成本。
🎯 应用场景
PhyNiKCE框架具有广泛的应用前景,可用于各种工业自动化场景,例如航空航天、汽车工程、能源等领域。它可以帮助工程师快速设计和优化流体动力学系统,提高产品性能和降低研发成本。此外,该框架的可扩展性和可审计性使其成为可信人工智能的重要组成部分。
📄 摘要(原文)
The deployment of autonomous agents for Computational Fluid Dynamics (CFD), is critically limited by the probabilistic nature of Large Language Models (LLMs), which struggle to enforce the strict conservation laws and numerical stability required for physics-based simulations. Reliance on purely semantic Retrieval Augmented Generation (RAG) often leads to "context poisoning," where agents generate linguistically plausible but physically invalid configurations due to a fundamental Semantic-Physical Disconnect. To bridge this gap, this work introduces PhyNiKCE (Physical and Numerical Knowledgeable Context Engineering), a neurosymbolic agentic framework for trustworthy engineering. Unlike standard black-box agents, PhyNiKCE decouples neural planning from symbolic validation. It employs a Symbolic Knowledge Engine that treats simulation setup as a Constraint Satisfaction Problem, rigidly enforcing physical constraints via a Deterministic RAG Engine with specialized retrieval strategies for solvers, turbulence models, and boundary conditions. Validated through rigorous OpenFOAM experiments on practical, non-tutorial CFD tasks using Gemini-2.5-Pro/Flash, PhyNiKCE demonstrates a 96% relative improvement over state-of-the-art baselines. Furthermore, by replacing trial-and-error with knowledge-driven initialization, the framework reduced autonomous self-correction loops by 59% while simultaneously lowering LLM token consumption by 17%. These results demonstrate that decoupling neural generation from symbolic constraint enforcement significantly enhances robustness and efficiency. While validated on CFD, this architecture offers a scalable, auditable paradigm for Trustworthy Artificial Intelligence in broader industrial automation.