BeamVQ: Aligning Space-Time Forecasting Model via Self-training on Physics-aware Metrics

作者: Hao Wu, Xingjian Shi, Ziyue Huang, Penghao Zhao, Wei Xiong, Jinbao Xue, Yangyu Tao, Xiaomeng Huang, Weiyan Wang

分类: cs.LG, cs.AI

发布日期: 2024-05-27

💡 一句话要点

提出BeamVQ，通过物理感知指标自训练对齐时空预测模型，显著提升预测的物理合理性。

🎯 匹配领域: 支柱四：生成式动作 (Generative Motion)

关键词: 时空预测 物理感知 自训练 向量量化 束搜索

📋 核心要点

数据驱动的时空预测模型忽略物理定律，导致预测结果不符合物理规律。
BeamVQ通过物理感知指标筛选模型自生成的样本，并用筛选后的数据进行自训练。
实验表明，BeamVQ在多个数据集和骨干网络上显著提升了统计技能评分和物理感知指标。

📝 摘要（中文）

本文提出了一种名为“基于向量量化的束搜索”（BeamVQ）的方法，旨在增强数据驱动时空预测模型的物理对齐性。与传统模型驱动的数值方法不同，数据驱动的深度学习方法通过优化统计指标来学习模式，容易忽略对物理定律的遵循，导致预测结果不符合物理规律。BeamVQ的核心思想是利用物理感知指标过滤自生成样本，并在这些样本上训练模型。为了灵活支持不同的骨干网络架构，BeamVQ利用码本将任意编码器-解码器模型从连续状态空间转换为离散码。然后，迭代地使用束搜索采样高质量序列，保留具有最高物理感知分数的序列，并在新数据集上训练模型。综合实验表明，BeamVQ不仅在五个数据集上的十个骨干网络上平均提升了32%以上的统计技能评分，而且显著增强了物理感知指标。

🔬 方法详解

问题定义：数据驱动的时空预测模型虽然在统计指标上表现良好，但往往忽略了物理定律的约束，导致预测结果在物理上不合理。现有的方法难以保证预测结果的物理一致性，这是一个重要的痛点。

核心思路：论文的核心思路是，即使数据驱动的模型会产生大量预测结果，其中一些结果会比其他结果更符合物理规律。因此，可以通过某种方式筛选出这些“高质量”的预测结果，并用它们来重新训练模型，从而提高模型整体的物理合理性。

技术框架：BeamVQ包含以下主要阶段：1) 向量量化：利用码本将连续状态空间转换为离散码，使得可以使用束搜索。2) 束搜索采样：使用束搜索从模型中采样多个预测序列。3) 物理感知评分：使用物理感知指标对采样得到的序列进行评分。4) 数据筛选：保留评分最高的序列，形成新的训练数据集。5) 模型重训练：使用新的训练数据集重新训练模型。

关键创新：BeamVQ的关键创新在于利用物理感知指标进行自训练。它不是直接在原始数据上训练模型，而是通过模型自身生成数据，并利用物理规律对生成的数据进行筛选，从而引导模型学习更符合物理规律的模式。此外，使用向量量化使得该方法可以灵活地应用于不同的骨干网络架构。

关键设计：BeamVQ使用向量量化将连续状态空间离散化，码本的大小是一个重要的参数。物理感知指标的选择需要根据具体的物理系统进行设计，例如，可以利用能量守恒、质量守恒等物理定律来构建评分函数。束搜索的宽度（beam size）决定了采样的多样性，需要根据计算资源和性能进行权衡。损失函数通常采用标准的预测损失函数，例如均方误差（MSE）。

🖼️ 关键图片

📊 实验亮点

实验结果表明，BeamVQ在五个数据集上的十个骨干网络上平均提升了32%以上的统计技能评分。更重要的是，BeamVQ显著提升了物理感知指标，表明该方法能够有效提高预测结果的物理合理性。这些结果验证了BeamVQ的有效性和优越性。

🎯 应用场景

BeamVQ可以应用于各种需要进行时空预测的领域，例如气象预报、海洋环境预测、交通流量预测、电力负荷预测等。通过提高预测结果的物理合理性，可以为决策提供更可靠的依据，减少因不准确预测带来的风险。该方法具有广泛的应用前景和重要的实际价值。

📄 摘要（原文）

Data-driven deep learning has emerged as the new paradigm to model complex physical space-time systems. These data-driven methods learn patterns by optimizing statistical metrics and tend to overlook the adherence to physical laws, unlike traditional model-driven numerical methods. Thus, they often generate predictions that are not physically realistic. On the other hand, by sampling a large amount of high quality predictions from a data-driven model, some predictions will be more physically plausible than the others and closer to what will happen in the future. Based on this observation, we propose \emph{Beam search by Vector Quantization} (BeamVQ) to enhance the physical alignment of data-driven space-time forecasting models. The key of BeamVQ is to train model on self-generated samples filtered with physics-aware metrics. To be flexibly support different backbone architectures, BeamVQ leverages a code bank to transform any encoder-decoder model to the continuous state space into discrete codes. Afterwards, it iteratively employs beam search to sample high-quality sequences, retains those with the highest physics-aware scores, and trains model on the new dataset. Comprehensive experiments show that BeamVQ not only gave an average statistical skill score boost for more than 32% for ten backbones on five datasets, but also significantly enhances physics-aware metrics.

BeamVQ: Aligning Space-Time Forecasting Model via Self-training on Physics-aware Metrics

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理