Automatic Fact-checking in English and Telugu
作者: Ravi Kiran Chikkala, Tatiana Anikina, Natalia Skachkova, Ivan Vykopal, Rodrigo Agerri, Josef van Genabith
分类: cs.CL
发布日期: 2025-09-30 (更新: 2025-11-18)
备注: Proceedings of the First Workshop on Advancing NLP for Low Resource Languages associated with RANLP 2025 Varna Bulgaria September 13 2025 pages 140-151
💡 一句话要点
构建英-泰双语数据集,探索大型语言模型在英语和泰卢固语事实核查中的有效性。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 事实核查 大型语言模型 多语言处理 英-泰双语数据集 自然语言处理
📋 核心要点
- 手动核查事实性声明耗时耗力,现有方法难以有效应对大规模虚假信息。
- 论文提出利用大型语言模型进行事实核查,并构建英-泰双语数据集以支持多语言环境。
- 通过实验评估不同LLM在英语和泰卢固语上的事实核查性能,为多语言事实核查提供基准。
📝 摘要(中文)
虚假信息构成了一项重大的全球性挑战,而手动验证声明既耗时又耗费资源。在这篇研究论文中,我们通过实验不同的方法,来研究大型语言模型(LLMs)在英语和泰卢固语中,根据事实的准确性对事实性声明进行分类并生成理由的有效性。这项工作的主要贡献包括创建了一个英-泰双语数据集,并对基于LLMs的不同真实性分类方法进行了基准测试。
🔬 方法详解
问题定义:论文旨在解决英语和泰卢固语两种语言环境下的自动事实核查问题。现有方法依赖人工标注和规则,难以扩展到多种语言,且效率低下。大型语言模型虽然展现出强大的语言理解能力,但在事实核查方面的性能仍需评估,尤其是在低资源语言(如泰卢固语)上的表现。
核心思路:论文的核心思路是利用大型语言模型(LLMs)的强大语言理解和生成能力,直接对声明的真实性进行分类,并生成相应的理由。通过在英-泰双语数据集上进行训练和评估,探索LLMs在不同语言上的事实核查能力,并为多语言事实核查提供有效方法。
技术框架:论文的技术框架主要包含以下几个阶段:1) 构建英-泰双语事实核查数据集;2) 选择和微调大型语言模型;3) 设计实验方案,评估不同LLM在英语和泰卢固语上的事实核查性能;4) 分析实验结果,比较不同方法的优劣,并探讨未来研究方向。具体模型选择和训练细节在论文中未详细说明,属于未知信息。
关键创新:论文的关键创新在于构建了一个英-泰双语事实核查数据集,为多语言事实核查研究提供了数据基础。此外,论文还对基于LLMs的不同真实性分类方法进行了基准测试,为后续研究提供了参考。
关键设计:论文中关于关键设计的具体细节描述较少,例如LLM的具体选择、微调策略、损失函数设计等。这些细节可能在实验部分有所涉及,但摘要中并未明确指出。数据集构建的具体方法(例如数据来源、标注流程等)也未详细说明,属于未知信息。
📊 实验亮点
论文构建了英-泰双语数据集,并对不同LLM进行了基准测试。虽然摘要中没有给出具体的性能数据和提升幅度,但该研究为多语言事实核查提供了一个重要的起点,并为后续研究提供了宝贵的经验和数据资源。
🎯 应用场景
该研究成果可应用于新闻媒体、社交平台等领域,自动识别和标记虚假信息,减少错误信息传播,提升信息可信度。未来可扩展到更多语言,构建更完善的多语言事实核查系统,助力净化网络环境,维护社会稳定。
📄 摘要(原文)
False information poses a significant global challenge, and manually verifying claims is a time-consuming and resource-intensive process. In this research paper, we experiment with different approaches to investigate the effectiveness of large language models (LLMs) in classifying factual claims by their veracity and generating justifications in English and Telugu. The key contributions of this work include the creation of a bilingual English-Telugu dataset and the benchmarking of different veracity classification approaches based on LLMs.