A generalized Wasserstein-2 distance approach for efficient reconstruction of random field models using stochastic neural networks

📄 arXiv: 2507.05143v1 📥 PDF

作者: Mingtao Xia, Qijing Shen

分类: cs.LG

发布日期: 2025-07-07


💡 一句话要点

提出一种广义Wasserstein-2距离方法,利用随机神经网络高效重建随机场模型。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 随机场模型 Wasserstein距离 随机神经网络 不确定性量化 混合随机变量

📋 核心要点

  1. 现有方法在处理包含连续和分类分量的混合随机变量的随机场模型重建问题时存在效率瓶颈。
  2. 论文提出利用广义Wasserstein-2距离,训练随机神经网络来逼近随机场模型,从而实现高效重建。
  3. 实验表明,该方法在分类、混合随机变量分布重建和学习复杂噪声动力系统等任务中表现出色。

📝 摘要(中文)

本文提出了一种新颖的广义Wasserstein-2距离方法,用于高效训练随机神经网络以重建随机场模型,其中目标随机变量包含连续和分类分量。我们证明了在非限制性条件下,随机神经网络可以在Wasserstein-2距离度量下逼近随机场模型。此外,该随机神经网络可以通过最小化我们提出的广义局部平方Wasserstein-2损失函数来有效地训练。我们在各种不确定性量化任务中展示了我们提出的方法的有效性,包括分类、重建混合随机变量的分布以及从时空数据中学习复杂的噪声动力系统。

🔬 方法详解

问题定义:论文旨在解决随机场模型重建问题,特别是当随机变量包含连续和分类混合分量时,现有方法通常效率较低。传统的随机场模型重建方法可能难以处理这种混合类型的数据,或者需要大量的计算资源才能达到可接受的精度。因此,需要一种更高效的方法来重建这类随机场模型。

核心思路:论文的核心思路是利用随机神经网络来逼近随机场模型,并使用广义Wasserstein-2距离作为训练的度量标准。Wasserstein距离能够有效地衡量两个概率分布之间的差异,特别是在处理具有不同支撑集的分布时。通过最小化随机神经网络输出分布与目标随机场模型分布之间的Wasserstein距离,可以训练网络学习到随机场模型的结构。

技术框架:整体框架包含以下几个主要步骤:1) 定义包含连续和分类分量的目标随机场模型。2) 构建一个随机神经网络,其输出能够表示混合类型的随机变量。3) 定义广义Wasserstein-2距离,用于衡量神经网络输出分布与目标随机场模型分布之间的差异。4) 使用梯度下降等优化算法,最小化广义局部平方Wasserstein-2损失函数,从而训练随机神经网络。

关键创新:论文的关键创新在于提出了广义Wasserstein-2距离,并将其应用于随机神经网络的训练中,以重建包含连续和分类分量的随机场模型。这种广义Wasserstein-2距离能够有效地处理混合类型的数据,并且可以用于训练随机神经网络,使其能够逼近复杂的随机场模型。此外,论文还证明了在非限制性条件下,随机神经网络可以在Wasserstein-2距离度量下逼近随机场模型。

关键设计:关键设计包括:1) 随机神经网络的结构,需要能够输出混合类型的随机变量,例如,可以使用高斯混合模型来表示连续分量,使用softmax函数来表示分类分量。2) 广义局部平方Wasserstein-2损失函数的定义,需要能够有效地衡量混合类型分布之间的差异。3) 优化算法的选择,例如,可以使用Adam优化器来加速训练过程。4) 针对具体任务的超参数调整,例如,学习率、批大小等。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过实验验证了所提出方法的有效性。在分类任务中,该方法能够准确地对数据进行分类。在重建混合随机变量分布的任务中,该方法能够有效地逼近目标分布。在学习复杂噪声动力系统的任务中,该方法能够从时空数据中学习到系统的动态特性。实验结果表明,该方法在各种不确定性量化任务中均表现出色,相较于传统方法具有更高的效率和精度。

🎯 应用场景

该研究成果可广泛应用于不确定性量化领域,例如:复杂材料的建模、气候变化预测、金融风险评估等。通过高效地重建随机场模型,可以更好地理解和预测复杂系统的行为,从而为决策提供更可靠的依据。未来,该方法有望扩展到更高维度、更复杂的随机场模型重建问题。

📄 摘要(原文)

In this work, we propose a novel generalized Wasserstein-2 distance approach for efficiently training stochastic neural networks to reconstruct random field models, where the target random variable comprises both continuous and categorical components. We prove that a stochastic neural network can approximate random field models under a Wasserstein-2 distance metric under nonrestrictive conditions. Furthermore, this stochastic neural network can be efficiently trained by minimizing our proposed generalized local squared Wasserstein-2 loss function. We showcase the effectiveness of our proposed approach in various uncertainty quantification tasks, including classification, reconstructing the distribution of mixed random variables, and learning complex noisy dynamical systems from spatiotemporal data.