From Articles to Premises: Building PrimeFacts, an Extraction Methodology and Resource for Fact-Checking Evidence

作者: Premtim Sahitaj, Jawan Kolanowski, Ariana Sahitaj, Veronika Solopova, Max Upravitelev, Daniel Röder, Iffat Maab, Junichi Yamagishi, Sebastian Möller, Vera Schmitt

分类: cs.CL

发布日期: 2026-05-07

备注: Accepted at LREC 2026. To appear in the conference proceedings

💡 一句话要点

提出PrimeFacts数据集与提取框架，通过LLM去语境化重写事实核查证据以提升自动验证性能。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 事实核查 大语言模型 证据检索 自然语言处理 去语境化 信息抽取

📋 核心要点

现有事实核查文章多为非结构化文本，导致自动验证系统难以直接提取和利用其中的关键证据。
提出PrimeFacts框架，利用超链接作为锚点，通过大语言模型将证据重写为独立的前提（Premises）。
实验表明，去语境化证据在检索和验证任务中表现优异，MRR提升达30%，Macro-F1提升10-20个百分点。

📝 摘要（中文）

事实核查文章蕴含丰富的证据与推理逻辑，但由于其非结构化的呈现方式，自动验证系统难以有效利用。本文提出了PrimeFacts，一套从完整事实核查文章中提取细粒度证据的方法论与资源库。研究团队整理了13,106篇PolitiFact文章，包含声明、裁决及所有引用来源，并识别出49,718个超链接作为定位关键证据的自然锚点。该框架利用大语言模型（LLMs）将锚点句子重写为独立、无语境依赖的“前提”（premises），并探索了隐式证据的提取。在跨文章证据检索与声明验证任务的评估中，提取出的前提显著提升了模型性能。去语境化的证据具有更高的可检索性，其平均倒数排名（MRR）较原文句子提升高达30%，且在裁决预测任务中，Macro-F1值较基线提升了10-20个百分点。定性分析表明，去语境化的前提忠实于原始来源。本研究展示了复用事实核查证据进行自动化的潜力，并提供了大规模结构化证据资源。

🔬 方法详解

问题定义：事实核查文章中包含大量支持性证据，但这些证据往往嵌入在复杂的叙述语境中，缺乏独立性，导致下游自动验证模型难以精准定位和利用这些证据进行推理。

核心思路：利用文章中指向外部来源的超链接作为“锚点”，定位关键证据片段。通过大语言模型（LLM）的语义重写能力，将这些依赖上下文的片段转化为独立、自包含的“前提”（Premises），从而消除语境依赖，提升检索与推理效率。

技术框架：首先进行数据清洗与锚点识别，提取包含证据的句子；随后利用LLM对锚点句子进行去语境化重写，生成独立前提；最后构建证据检索与裁决预测模块，验证提取出的前提在下游任务中的有效性。

关键创新：将事实核查文章中的超链接作为结构化证据的自然锚点，并引入LLM作为“去语境化”工具，实现了从非结构化文本到结构化证据库的自动化转换，解决了证据检索中的语境噪声问题。

关键设计：采用了基于LLM的提示工程（Prompt Engineering）进行文本重写，确保重写后的前提在保持语义忠实度的同时，具备独立于原文的完整性。在评估中，对比了不同裁决粒度（2-class vs 5-class）下的模型表现，验证了方法的鲁棒性。

🖼️ 关键图片

📊 实验亮点

实验结果显示，去语境化前提在证据检索任务中表现卓越，MRR指标较原文句子提升高达30%。在裁决预测任务中，使用该方法提取的证据使Macro-F1值提升了10-20个百分点，且在不同模型架构和裁决粒度下均表现出一致的性能增益，证明了该资源在事实核查领域的实用价值。

🎯 应用场景

该研究可广泛应用于自动化事实核查系统、智能新闻辅助写作及舆情监测平台。通过构建高质量的结构化证据库，能够显著提升AI模型在虚假信息检测、新闻真实性评估及复杂逻辑推理任务中的准确性与可解释性。

📄 摘要（原文）

Fact-checking articles encode rich supporting evidence and reasoning, yet this evidence remains largely inaccessible to automated verification systems due to unstructured presentation. We introduce PrimeFacts, a methodology and resource for extracting fine-grained evidence from full fact-checking articles. We compile 13,106 PolitiFact articles with claims, verdicts, and all referenced sources, and we identify 49,718 in-article hyperlinks as natural anchors to pinpoint key evidence. Our framework leverages large language models (LLMs) to rewrite these anchor sentences into stand-alone, context-independent premises and investigates the extraction of additional implicit evidence. In evaluations on cross-article evidence retrieval and claim verification, the extracted premises substantially improve performance. Decontextualized evidence yields higher retrievability, achieving up to a 30 percent relative gain in Mean Reciprocal Rank over verbatim sentences, and using the evidence for verdict prediction raises Macro-F1 by 10-20 points over the baseline. These gains are consistent across different verdict granularities (2-class vs. 5-class) and model architectures. A qualitative analysis indicates that the decontextualized premises remain faithful to the original sources. Our work highlights the promise of reusing fact-checkers' evidence for automation and provides a large-scale resource of structured evidence from real-world fact-checks.

From Articles to Premises: Building PrimeFacts, an Extraction Methodology and Resource for Fact-Checking Evidence

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理