TADI: Tool-Augmented Drilling Intelligence via Agentic LLM Orchestration over Heterogeneous Wellsite Data

📄 arXiv: 2605.00060v1 📥 PDF

作者: Rong Lu

分类: cs.AI, eess.SY

发布日期: 2026-04-30

DOI: 10.20944/preprints202604.1820.v1


💡 一句话要点

TADI:通过Agentic LLM编排异构井场数据,实现工具增强的钻井智能

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agentic LLM 钻井智能 异构数据集成 领域专用工具 证据基础评分 油气行业 自动化推理

📋 核心要点

  1. 现有钻井数据分析方法难以有效整合异构数据源,并缺乏自动化证据收集和推理能力,导致决策效率低下。
  2. TADI通过Agentic LLM编排领域专用工具,实现对结构化和非结构化井场数据的智能分析,从而支持基于证据的钻井决策。
  3. 实验表明,TADI能够零错误解析大量钻井报告,并能有效处理复杂的数据集成问题,证明了其在实际应用中的可行性。

📝 摘要(中文)

本文提出TADI(工具增强的钻井智能),一个agentic AI系统,将钻井操作数据转化为基于证据的分析智能。TADI应用于Equinor Volve油田数据集,集成了1,759份每日钻井报告、选定的WITSML实时对象、15,634条生产记录、地层顶部和射孔数据到一个双存储架构中:DuckDB用于对包含65,447行数据的12个表进行结构化查询,ChromaDB用于对36,709个嵌入文档进行语义搜索。由大型语言模型通过迭代函数调用编排的12个领域专用工具,支持多步骤证据收集,将结构化钻井测量数据与每日报告叙述进行交叉引用。该系统零错误地解析了所有1,759个DDR XML文件,处理了三种不兼容的井名命名约定,并由95个自动化测试和一个包含六个操作类别的130个问题的压力测试分类法提供支持。我们将agent的行为形式化为顺序工具选择问题,并提出证据基础评分(EGS)作为基于测量、归因的DDR引用和所需答案部分的简单基础合规性代理。完整的6,084行、无框架实现是可重现的,前提是公开的Volve下载和一个API密钥,案例研究和定性消融分析表明,领域专用工具设计,而非模型规模本身,是技术操作中分析质量的主要驱动因素。

🔬 方法详解

问题定义:论文旨在解决油气钻井领域中,如何有效利用海量异构数据(包括结构化的实时数据和非结构化的报告文本)进行智能分析和决策的问题。现有方法通常依赖人工分析,效率低下且容易出错,难以充分挖掘数据中的潜在价值。

核心思路:论文的核心思路是构建一个基于Agentic LLM的系统,该系统能够像专家一样,根据任务需求,自动选择和调用合适的工具,从不同的数据源中提取相关信息,并进行推理和分析,最终生成基于证据的结论。这种方法能够显著提高数据分析的效率和准确性。

技术框架:TADI系统的整体架构包括以下几个主要模块:1) 数据存储层:采用双存储架构,DuckDB用于存储结构化数据,ChromaDB用于存储非结构化文本数据的嵌入向量。2) 工具层:包含12个领域专用工具,用于执行特定的数据查询、分析和处理任务。3) Agentic LLM编排层:使用大型语言模型作为智能体,负责根据任务需求,选择和调用合适的工具,并进行迭代推理。4) 评估层:使用证据基础评分(EGS)来评估Agent的推理过程和结果的质量。

关键创新:论文的关键创新在于将Agentic LLM与领域专用工具相结合,构建了一个能够自动进行多步骤证据收集和推理的系统。与传统的基于规则或机器学习的方法相比,TADI具有更强的灵活性和可扩展性,能够更好地适应复杂的钻井环境。此外,EGS的提出为评估Agent的推理质量提供了一种新的思路。

关键设计:在工具设计方面,论文强调了领域专业性,针对钻井领域的特定任务,设计了专门的工具。在Agentic LLM编排方面,采用了迭代函数调用的方式,允许Agent根据中间结果动态调整工具选择策略。EGS的计算结合了测量数据、报告引用和答案完整性,从而能够更全面地评估Agent的推理质量。

📊 实验亮点

TADI在Equinor Volve油田数据集上进行了验证,实现了零错误解析1759份钻井报告,并能有效处理三种不同的井名命名规范。案例研究和消融分析表明,领域专用工具的设计对分析质量至关重要,其重要性超过了模型规模本身。证据基础评分(EGS)为评估Agent的推理质量提供了一种新的方法。

🎯 应用场景

TADI具有广泛的应用前景,可用于提高钻井作业的效率和安全性,优化生产策略,降低成本。该系统还可以应用于其他类似的工业领域,例如石油化工、智能制造等,为复杂系统的智能决策提供支持。未来,TADI有望成为油气行业数字化转型的重要推动力。

📄 摘要(原文)

We present TADI (Tool-Augmented Drilling Intelligence), an agentic AI system that transforms drilling operational data into evidence-based analytical intelligence. Applied to the Equinor Volve Field dataset, TADI integrates 1,759 daily drilling reports, selected WITSML real-time objects, 15,634 production records, formation tops, and perforations into a dual-store architecture: DuckDB for structured queries over 12 tables with 65,447 rows, and ChromaDB for semantic search over 36,709 embedded documents. Twelve domain-specialized tools, orchestrated by a large language model via iterative function calling, support multi-step evidence gathering that cross-references structured drilling measurements with daily report narratives. The system parses all 1,759 DDR XML files with zero errors, handles three incompatible well naming conventions, and is backed by 95 automated tests plus a 130-question stress-question taxonomy spanning six operational categories. We formalize the agent's behavior as a sequential tool-selection problem and propose the Evidence Grounding Score (EGS) as a simple grounding-compliance proxy based on measurements, attributed DDR quotations, and required answer sections. The complete 6,084-line, framework-free implementation is reproducible given the public Volve download and an API key, and the case studies and qualitative ablation analysis suggest that domain-specialized tool design, rather than model scale alone, is the primary driver of analytical quality in technical operations.