AI models of unstable flow exhibit hallucination

作者: Ramdhan Wibawa, Birendra Jha

分类: physics.flu-dyn, cs.AI, cs.LG, nlin.PS

发布日期: 2026-04-22

💡 一句话要点

提出DeepFingers框架，解决AI流体模型中不稳定性流动模拟的幻觉问题

🎯 匹配领域: 支柱八：物理动画 (Physics-based Animation) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 流体动力学 AI模型 粘性指进 谱偏置 傅里叶神经算子 深度算子网络 不稳定流动 幻觉

📋 核心要点

现有AI流体模型在模拟不稳定流动时，由于谱偏置，会产生视觉上合理但物理上错误的“幻觉”现象。
DeepFingers框架结合傅里叶神经算子和深度算子网络，在全谱上平衡学习，从而抑制幻觉。
实验表明，DeepFingers能准确捕捉粘性指进的复杂模式，并保持全局混合指标的准确性。

📝 摘要（中文）

本文首次系统性地揭示了流体动力学AI模型中的幻觉现象，以粘性指进这一经典的不稳定流动问题为例。由于快速演化的多尺度指进模式难以精确解析，基于AI的流动建模面临挑战。研究发现，AI模型会产生视觉上逼真但物理上不合理的解，类似于大型语言模型中的幻觉，表现为虚假的流体界面和违反守恒定律的逆扩散。这些幻觉源于AI模型的谱偏置，在高流速和高粘度比下尤为明显。为此，本文提出了一种新的AI驱动流体动力学框架DeepFingers，通过结合傅里叶神经算子和深度算子网络，在空间模式的全谱上强制平衡学习，从而预测粘性指进的时空演化。DeepFingers能够准确捕捉尖端分裂、指状融合和通道形成，同时保持混合的全局指标。该研究为探索物理系统AI模型的根本局限性开辟了新的研究方向。

🔬 方法详解

问题定义：论文旨在解决AI模型在模拟流体动力学中不稳定流动（特别是粘性指进）时出现的“幻觉”问题。现有AI模型在处理此类问题时，由于其固有的谱偏置，倾向于学习低频信息而忽略高频信息，导致模型生成视觉上看似合理但违反物理定律的解，例如虚假的流体界面和逆扩散现象。这些幻觉严重影响了AI模型在流体动力学领域的可靠性和应用价值。

核心思路：论文的核心思路是通过平衡AI模型在不同频率上的学习能力，从而抑制谱偏置导致的幻觉。具体来说，作者认为需要让模型能够同时关注低频的全局流动模式和高频的局部细节，从而更准确地捕捉不稳定流动的复杂演化过程。

技术框架：DeepFingers框架结合了傅里叶神经算子（Fourier Neural Operator, FNO）和深度算子网络（Deep Operator Network, DeepONet）。FNO用于学习全局的流动模式，它在傅里叶空间进行卷积操作，能够有效地捕捉长程依赖关系。DeepONet则用于学习局部细节，它将输入空间映射到高维特征空间，然后通过非线性变换来预测输出。整个框架以时间和粘度比为条件，学习连续浓度场之间的映射关系。

关键创新：该论文的关键创新在于提出了DeepFingers框架，该框架通过结合FNO和DeepONet，实现了在空间模式全谱上的平衡学习。与传统的AI流体模型相比，DeepFingers能够更有效地抑制谱偏置，从而减少幻觉的产生。此外，该框架还引入了条件学习机制，允许模型根据不同的时间和粘度比来调整其预测行为。

关键设计：DeepFingers框架的关键设计包括：1) 使用FNO捕捉全局流动模式；2) 使用DeepONet捕捉局部细节；3) 使用时间和粘度比作为条件输入，实现条件学习；4) 使用合适的损失函数来优化模型，例如均方误差损失函数。具体的网络结构和参数设置需要根据具体的实验数据进行调整。

🖼️ 关键图片

📊 实验亮点

实验结果表明，DeepFingers框架能够准确捕捉粘性指进过程中的尖端分裂、指状融合和通道形成等复杂现象，显著优于传统的AI模型。与基线模型相比，DeepFingers在保持全局混合指标准确性的同时，有效地抑制了幻觉的产生。具体性能数据（例如误差率、相似度指标等）未在摘要中明确给出，但强调了其在视觉效果和物理合理性上的显著提升。

🎯 应用场景

该研究成果可应用于更广泛的流体动力学模拟领域，例如多孔介质中的油藏模拟、微流控器件设计、以及生物医学工程中的血液流动分析等。通过提高AI模型在不稳定流动模拟中的准确性和可靠性，可以加速相关领域的研发进程，并为工程设计提供更可靠的依据。未来，该方法有望推广到其他物理系统的AI建模中，解决类似的不稳定性问题。

📄 摘要（原文）

We report the first systematic evidence of hallucination in AI models of fluid dynamics, demonstrated in the canonical problem of hydrodynamically unstable transport known as viscous fingering. AI-based modeling of flow with instabilities remains challenging because rapidly evolving, multiscale fingering patterns are difficult to resolve accurately. We identify solutions that appear visually realistic yet are physically implausible, analogous to hallucinations in large language models. These hallucinations manifest as spurious fluid interfaces and reverse diffusion that violate conservation laws. We show that their origin lies in the spectral bias of AI models, which becomes dominant at high flow rates and viscosity contrasts. Guided by this insight, we introduce DeepFingers, a new framework for AI-driven fluid dynamics that enforces balanced learning across the full spectrum of spatial modes by combining the Fourier Neural Operator with a Deep Operator Network to predict the spatiotemporal evolution of viscous fingers. By conditioning on both time and viscosity contrast, DeepFingers learns mappings between successive concentration fields across regimes. The framework accurately captures tip splitting, finger merging, and channel formation while preserving global metrics of mixing. The results open a new research direction to investigate fundamental limitations in AI models of physical systems.

AI models of unstable flow exhibit hallucination

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理