Automatización de Informes Geotécnicos para Macizos Rocosos con IA

📄 arXiv: 2511.04690v1 📥 PDF

作者: Christofer Valencia, Alexis Llumigusín, Silvia Alvarez, Abrahan Arias, Christian Mejia-Escobar

分类: cs.MM, cs.CL

发布日期: 2025-10-27

备注: 17 pages, in Spanish language


💡 一句话要点

提出基于多模态大语言模型的岩土工程报告自动生成方法,提升效率并减少主观误差。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 岩土工程 多模态大语言模型 报告自动化 提示工程 地质勘探

📋 核心要点

  1. 传统岩土工程报告依赖人工观测和主观判断,效率低且容易出错,难以满足现代工程需求。
  2. 该论文提出利用多模态大语言模型,通过图像和现场数据自动生成岩土工程报告,减少人工干预。
  3. 实验结果表明,自动生成的报告与专家报告具有可比性,BLEU和ROUGE-L指标分别为0.455和0.653。

📝 摘要(中文)

岩土工程报告对于评估岩石地层的稳定性至关重要,是现代工程安全保障的基础。传统报告依赖于人工现场观测,使用罗盘、放大镜和笔记本等工具,效率低下,易出错,且解释具有主观性。为了克服这些局限性,本文提出利用人工智能技术,通过处理图像和现场数据自动生成报告。该方法基于岩石露头的照片、人工样本及其描述,以及岩土工程研究课程中编写的报告。这些资源用于定义报告大纲、提示工程,并验证多模态大语言模型(MLLM)的响应。通过迭代优化提示,获得针对报告每个部分的结构化和特定指令,证明是微调MLLM这种高成本过程的有效替代方案。系统评估的BLEU和ROUGE-L指标值分别为0.455和0.653,表明自动生成的描述与专家生成的描述具有可比性。该工具可通过Web访问,具有直观的界面,并能够导出为标准化格式,代表着一种创新,对地质领域的专业人士和学生具有重要贡献。

🔬 方法详解

问题定义:传统岩土工程报告的编制依赖于地质专家的现场人工观测和主观判断,过程耗时且容易引入人为误差。现有的方法缺乏自动化手段,难以保证报告的准确性和一致性,也难以应对大规模工程项目的需求。因此,如何利用人工智能技术提高岩土工程报告的编制效率和质量是一个亟待解决的问题。

核心思路:该论文的核心思路是利用多模态大语言模型(MLLM)处理岩石露头的图像和现场数据,并根据预定义的报告大纲自动生成岩土工程报告。通过提示工程(Prompt Engineering)迭代优化模型的输出,使其能够生成结构化和特定于报告各部分的描述。这种方法避免了对MLLM进行昂贵的微调,降低了成本和复杂度。

技术框架:该方法的技术框架主要包括以下几个阶段:1) 数据收集:收集岩石露头的照片、人工样本及其描述,以及现有的岩土工程报告;2) 报告大纲定义:根据收集到的数据和领域知识,定义岩土工程报告的结构和内容;3) 提示工程:设计和优化针对MLLM的提示,使其能够根据输入的图像和数据生成报告的各个部分;4) 模型评估:使用BLEU和ROUGE-L等指标评估自动生成的报告与专家报告的相似度。

关键创新:该论文的关键创新在于利用提示工程来指导多模态大语言模型生成岩土工程报告,避免了对模型进行微调。这种方法降低了成本和复杂度,同时保证了报告的质量。此外,该方法还提出了一种将图像和现场数据融合到报告生成过程中的有效方法。

关键设计:论文的关键设计包括:1) 报告大纲的设计,需要充分考虑岩土工程报告的结构和内容;2) 提示的设计,需要针对报告的各个部分进行优化,使其能够生成准确和详细的描述;3) 模型评估指标的选择,需要能够反映自动生成的报告与专家报告的相似度。具体的参数设置、损失函数和网络结构等技术细节在论文中没有详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,通过提示工程指导多模态大语言模型生成的岩土工程报告与专家报告具有可比性,BLEU指标达到0.455,ROUGE-L指标达到0.653。这表明该方法在自动生成岩土工程报告方面具有良好的性能,能够满足实际应用的需求。

🎯 应用场景

该研究成果可应用于岩土工程、地质勘探、矿产资源开发等领域,为工程建设提供快速、准确的岩土工程报告。该工具能够降低人工成本,提高工作效率,并减少主观误差,具有重要的实际应用价值和推广前景。未来可进一步扩展到其他类型的地质报告自动生成。

📄 摘要(原文)

Geotechnical reports are crucial for assessing the stability of rock formations and ensuring safety in modern engineering. Traditionally, these reports are prepared manually based on field observations using compasses, magnifying glasses, and notebooks. This method is slow, prone to errors, and subjective in its interpretations. To overcome these limitations, the use of artificial intelligence techniques is proposed for the automatic generation of reports through the processing of images and field data. The methodology was based on the collection of photographs of rock outcrops and manual samples with their respective descriptions, as well as on the reports prepared during the Geotechnical Studies course. These resources were used to define the report outline, prompt engineering, and validate the responses of a multimodal large language model (MLLM). The iterative refinement of prompts until structured and specific instructions were obtained for each section of the report proved to be an effective alternative to the costly process of fine-tuning the MLLM. The system evaluation establishes values of 0.455 and 0.653 for the BLEU and ROUGE-L metrics, respectively, suggesting that automatic descriptions are comparable to those made by experts. This tool, accessible via the web, with an intuitive interface and the ability to export to standardized formats, represents an innovation and an important contribution for professionals and students of field geology.