Leveraging Time-Series Foundation Model for Subsurface Well Logs Prediction and Anomaly Detection

📄 arXiv: 2412.05681v1 📥 PDF

作者: Ardiansyah Koeshidayatullah, Abdulrahman Al-Fakih, SanLinn Ismael Kaka

分类: physics.geo-ph, cs.AI, cs.LG, eess.SP

发布日期: 2024-12-07


💡 一句话要点

利用时间序列基础模型预测井眼测井数据并进行异常检测

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 测井数据预测 异常检测 时间序列模型 Transformer TimeGPT

📋 核心要点

  1. 现有机器学习方法难以捕捉测井数据中复杂的非线性关系和长期依赖性,且泛化能力有限,需要针对新数据集重新训练。
  2. 论文提出利用时间序列基础模型TimeGPT,通过Transformer架构和生成式预训练方法,实现对测井数据的预测和异常检测。
  3. 实验结果表明,该模型在测井数据预测和异常检测方面表现出色,R2高达87%,MAPE低至1.95%,异常检测准确率达93%。

📝 摘要(中文)

能源需求的增长凸显了合适的地下储层的重要性,这需要详细而精确的地下特征描述,通常依赖于高质量的井眼测井数据。然而,获取完整的测井数据成本高昂且耗时,由于井眼条件或工具错误,数据缺失的情况很常见。虽然机器学习和深度学习算法已被用于解决这些问题,但它们通常无法捕捉复杂测井序列中错综复杂、非线性和长期依赖关系。此外,以往的AI驱动模型通常需要在引入新数据集时重新训练,并且仅限于在同一盆地中部署。本研究探索并评估了时间序列基础模型的潜力,该模型利用Transformer架构和生成式预训练方法来预测和检测井眼测井数据中的异常。具体而言,我们对TimeGPT架构进行了微调和调整,以高精度预测关键测井响应并检测异常。我们提出的模型表现出优异的性能,实现了高达87%的R2和低至1.95%的平均绝对百分比误差(MAPE)。此外,该模型的零样本能力成功识别出细微但关键的异常,例如钻井风险或意外的地质构造,总体准确率达到93%。该模型代表了预测精度和计算效率的显著进步,通过微调实现零样本推理。其在测井预测中的应用增强了运营决策,同时降低了与地下勘探相关的风险。这些发现证明了该模型在改变测井数据分析方面的潜力,尤其是在复杂的地质环境中。

🔬 方法详解

问题定义:论文旨在解决井眼测井数据缺失和异常检测的问题。现有机器学习方法难以捕捉测井数据中复杂的非线性关系和长期依赖性,且模型泛化能力差,需要针对新的地质盆地或数据集进行重新训练,成本高昂。

核心思路:论文的核心思路是利用时间序列基础模型TimeGPT的强大时间序列建模能力,通过Transformer架构学习测井数据的时序特征,并利用生成式预训练方法提高模型的泛化能力,从而实现高精度的测井数据预测和异常检测。

技术框架:整体框架包括数据预处理、模型微调和预测/异常检测三个阶段。首先,对原始测井数据进行清洗和标准化。然后,使用目标盆地的测井数据对TimeGPT模型进行微调,使其适应特定地质环境。最后,利用微调后的模型进行测井数据预测和异常检测。异常检测基于预测值与实际值的偏差进行判断。

关键创新:最重要的技术创新点在于将时间序列基础模型TimeGPT应用于测井数据分析。与传统的机器学习方法相比,TimeGPT能够更好地捕捉测井数据的时序依赖关系,并且具有更强的泛化能力,可以实现零样本推理。

关键设计:TimeGPT模型基于Transformer架构,采用生成式预训练方法进行训练。论文中,作者对TimeGPT模型进行了微调,使用了特定的损失函数(例如均方误差)来优化模型的预测性能。此外,作者还设计了一种基于预测误差的异常检测方法,通过设定阈值来判断测井数据是否异常。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该模型在测井数据预测方面表现出色,R2高达87%,MAPE低至1.95%。在零样本异常检测任务中,该模型能够成功识别出细微但关键的异常,例如钻井风险或意外的地质构造,总体准确率达到93%。这些结果表明,该模型具有很强的实用价值。

🎯 应用场景

该研究成果可应用于油气勘探开发、地质灾害预警等领域。通过准确预测缺失的测井数据,可以降低勘探成本,提高勘探效率。通过及时检测异常测井数据,可以预警潜在的钻井风险和地质灾害,保障生产安全。该模型还可用于优化油藏管理,提高采收率。

📄 摘要(原文)

The rise in energy demand highlights the importance of suitable subsurface storage, requiring detailed and accurate subsurface characterization often reliant on high-quality borehole well log data. However, obtaining complete well-log data is costly and time-consuming, with missing data being common due to borehole conditions or tool errors. While machine learning and deep learning algorithms have been implemented to address these issues, they often fail to capture the intricate, nonlinear relationships and long-term dependencies in complex well log sequences. Additionally, prior AI-driven models typically require retraining when introduced to new datasets and are constrained to deployment in the same basin. In this study, we explored and evaluated the potential of a time-series foundation model leveraging transformer architecture and a generative pre-trained approach for predicting and detecting anomalies in borehole well log data. Specifically, we fine-tuned and adopted the TimeGPT architecture to forecast key log responses and detect anomalies with high accuracy. Our proposed model demonstrated excellent performance, achieving R2 of up to 87% and a mean absolute percentage error (MAPE) as low as 1.95%. Additionally, the model's zero-shot capability successfully identified subtle yet critical anomalies, such as drilling hazards or unexpected geological formations, with an overall accuracy of 93%. The model represents a significant advancement in predictive accuracy and computational efficiency, enabling zero-shot inference through fine-tuning. Its application in well-log prediction enhances operational decision-making while reducing risks associated with subsurface exploration. These findings demonstrate the model's potential to transform well-log data analysis, particularly in complex geological settings.