TextMine: Data, Evaluation Framework and Ontology-guided LLM Pipeline for Humanitarian Mine Action

作者: Chenyue Zhou, Gürkan Solmaz, Flavio Cirillo, Kiril Gashteovski, Jonathan Fürst

分类: cs.CL, cs.AI

发布日期: 2025-09-18 (更新: 2025-10-08)

💡 一句话要点

TextMine提出了一种本体指导的LLM流程，用于人道主义排雷行动中的知识提取。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 人道主义排雷行动 知识提取 大型语言模型 领域本体 非结构化数据

📋 核心要点

现有HMA机构的知识隐藏在非结构化报告中，阻碍了信息共享和利用。
TextMine构建数据集、评估框架和LLM流程，将非结构化报告转化为(主体、关系、客体)三元组。
实验表明，本体对齐的提示能显著提升知识提取的准确率、减少幻觉并增强格式一致性。

📝 摘要（中文）

人道主义排雷行动(HMA)旨在解决冲突地区地雷探测和清除的难题。HMA机构产生的大量拯救生命的操作知识都隐藏在非结构化报告中，限制了机构间的信息传递。为了解决这个问题，我们提出了TextMine：第一个用于HMA领域知识提取的数据集、评估框架和本体指导的大型语言模型(LLM)流程。TextMine将HMA报告结构化为(主体、关系、客体)三元组，从而创建特定领域的知识。为了确保与现实世界的关联性，我们与柬埔寨排雷行动中心(CMAC)合作创建了数据集。我们进一步引入了一种偏差感知评估框架，该框架将人工标注的三元组与LLM-as-Judge协议相结合，以减轻无参考评分中的位置偏差。实验表明，与基线模型相比，本体对齐的提示可将提取准确率提高高达44.2%，减少幻觉22.5%，并提高格式一致性20.9%。我们公开发布数据集和代码。

🔬 方法详解

问题定义：人道主义排雷行动领域积累了大量非结构化的报告数据，这些数据蕴含着重要的操作知识。然而，这些知识分散且难以访问，阻碍了不同机构之间的信息共享和经验学习。现有方法难以有效地从这些非结构化文本中提取出有用的知识，从而影响了排雷行动的效率和安全性。

核心思路：TextMine的核心思路是利用大型语言模型（LLM）的强大文本理解和生成能力，结合领域本体的指导，将非结构化的HMA报告转化为结构化的知识表示。通过将报告内容抽取为(主体、关系、客体)三元组，可以方便地进行知识存储、检索和推理，从而促进HMA领域内的知识共享和应用。

技术框架：TextMine的整体框架包含以下几个主要阶段：1) 数据集构建：与柬埔寨排雷行动中心(CMAC)合作，收集并标注HMA报告，构建领域数据集。2) 本体构建：构建HMA领域的本体，定义领域内的概念、关系和属性。3) LLM流程设计：设计基于LLM的知识提取流程，包括提示工程、模型微调和后处理等环节。4) 评估框架：设计偏差感知的评估框架，用于评估知识提取的准确性和可靠性。

关键创新：TextMine的关键创新在于将领域本体与LLM相结合，指导知识提取过程。通过本体对齐的提示，可以有效地提高LLM的知识提取准确率，减少幻觉，并增强格式一致性。此外，该研究还提出了偏差感知的评估框架，可以更准确地评估LLM在知识提取任务中的性能。

关键设计：在LLM流程设计中，采用了本体对齐的提示策略，即在提示中包含领域本体中的概念和关系信息，引导LLM生成符合领域知识的三元组。在评估框架中，结合了人工标注的三元组和LLM-as-Judge协议，以减轻位置偏差对评估结果的影响。具体参数设置和模型选择等细节在论文中进行了详细描述。

📊 实验亮点

实验结果表明，与基线模型相比，TextMine提出的本体对齐提示策略可以将知识提取准确率提高高达44.2%，减少幻觉22.5%，并提高格式一致性20.9%。这些结果表明，TextMine在HMA领域的知识提取任务中具有显著的优势。

🎯 应用场景

TextMine可应用于人道主义排雷行动领域，帮助HMA机构从大量非结构化报告中提取关键知识，提高排雷效率和安全性。该研究成果还可推广到其他领域，例如灾害救援、公共卫生等，为知识密集型任务提供有效的解决方案，促进领域知识的积累和应用。

📄 摘要（原文）

Humanitarian Mine Action (HMA) addresses the challenge of detecting and removing landmines from conflict regions. Much of the life-saving operational knowledge produced by HMA agencies is buried in unstructured reports, limiting the transferability of information between agencies. To address this issue, we propose TextMine: the first dataset, evaluation framework and ontology-guided large language model (LLM) pipeline for knowledge extraction in the HMA domain. TextMine structures HMA reports into (subject, relation, object)-triples, thus creating domain-specific knowledge. To ensure real-world relevance, we created the dataset in collaboration with Cambodian Mine Action Center (CMAC). We further introduce a bias-aware evaluation framework that combines human-annotated triples with an LLM-as-Judge protocol to mitigate position bias in reference-free scoring. Our experiments show that ontology-aligned prompts improve extraction accuracy by up to 44.2%, reduce hallucinations by 22.5%, and enhance format adherence by 20.9% compared to baseline models. We publicly release the dataset and code.

TextMine: Data, Evaluation Framework and Ontology-guided LLM Pipeline for Humanitarian Mine Action

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册