WINELL: Wikipedia Never-Ending Updating with LLM Agents
作者: Revanth Gangi Reddy, Tanay Dixit, Jiaxin Qin, Cheng Qian, Daniel Lee, Jiawei Han, Kevin Small, Xing Fan, Ruhi Sarikaya, Heng Ji
分类: cs.CL
发布日期: 2025-07-30
💡 一句话要点
WiNELL:利用LLM Agent持续更新维基百科知识
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: LLM Agent 维基百科更新 知识库维护 自动信息整合 多Agent系统
📋 核心要点
- 维基百科依赖人工编辑更新,存在时效性问题,难以快速反映最新知识。
- WiNELL利用多Agent框架,自动从网络聚合信息,筛选重要知识并生成编辑建议。
- 微调的编辑模型在信息覆盖和编辑效率上优于现有基线,实验验证了其有效性。
📝 摘要(中文)
维基百科作为一个庞大且持续被查阅的知识库,由于依赖人工编辑,在保持内容最新方面面临重大挑战。受NELL中持续知识获取愿景的启发,并受益于基于LLM的Agent的进步,本文介绍了WiNELL,一个用于持续更新维基百科文章的Agent框架。我们的方法采用多Agent框架来聚合在线信息,为维基百科中的目标实体选择新的和重要的知识,然后生成精确的编辑建议供人工审核。我们的微调编辑模型,在维基百科的大量人工编辑历史数据上训练,能够以符合人工编辑行为的方式整合更新。我们的编辑模型在关键信息覆盖和编辑效率方面优于开源指令跟随基线模型和闭源LLM(例如GPT-4o)。对高活跃度维基百科页面的端到端评估表明,WiNELL能够识别并建议及时的事实更新。这为LLM Agent自动更新知识库开辟了一个有希望的研究方向。
🔬 方法详解
问题定义:维基百科的内容更新依赖人工编辑,速度慢,无法及时反映最新的信息和知识。现有的方法难以自动地从海量信息中提取、验证并整合到维基百科中,保持其时效性和准确性。
核心思路:利用大型语言模型(LLM)作为Agent,模拟人工编辑的行为,自动从网络上搜集信息,提取关键事实,并生成符合维基百科编辑规范的更新建议。通过多Agent协作,提高信息获取的全面性和准确性。
技术框架:WiNELL采用多Agent框架,主要包含以下模块:1) 信息聚合Agent:负责从网络上搜集与目标实体相关的信息;2) 知识选择Agent:从搜集到的信息中筛选出新的、重要的知识;3) 编辑建议生成Agent:根据筛选出的知识,生成符合维基百科编辑规范的更新建议。这些建议最终需要人工审核。
关键创新:WiNELL的关键创新在于:1) 利用LLM Agent实现维基百科的自动更新,减少对人工编辑的依赖;2) 提出了一种微调的编辑模型,该模型在维基百科的人工编辑历史数据上进行训练,能够生成更符合人工编辑习惯的更新建议;3) 采用多Agent协作的方式,提高信息获取和知识选择的准确性和全面性。
关键设计:论文中提到,编辑模型是在维基百科的人工编辑历史数据上进行微调的,具体的技术细节(如损失函数、网络结构等)可能在论文正文中或补充材料中有更详细的描述。论文强调了编辑模型在关键信息覆盖和编辑效率方面的优势,这表明模型的设计目标是尽可能地覆盖重要的信息,并以高效的方式生成编辑建议。
🖼️ 关键图片
📊 实验亮点
WiNELL的编辑模型在关键信息覆盖和编辑效率方面优于开源指令跟随基线模型和闭源LLM(例如GPT-4o)。端到端评估表明,WiNELL能够识别并建议及时的事实更新,证明了其在自动更新维基百科方面的有效性。具体性能数据和提升幅度需要在论文中查找。
🎯 应用场景
WiNELL的研究成果可应用于自动知识库更新、智能信息整合、内容生成等领域。该技术能够提升知识库的时效性和准确性,减少人工维护成本,并为用户提供更全面、及时的信息服务。未来,该技术有望应用于其他类型的知识库和在线百科全书。
📄 摘要(原文)
Wikipedia, a vast and continuously consulted knowledge base, faces significant challenges in maintaining up-to-date content due to its reliance on manual human editors. Inspired by the vision of continuous knowledge acquisition in NELL and fueled by advances in LLM-based agents, this paper introduces WiNELL, an agentic framework for continuously updating Wikipedia articles. Our approach employs a multi-agent framework to aggregate online information, select new and important knowledge for a target entity in Wikipedia, and then generate precise edit suggestions for human review. Our fine-grained editing models, trained on Wikipedia's extensive history of human edits, enable incorporating updates in a manner consistent with human editing behavior. Our editor models outperform both open-source instruction-following baselines and closed-source LLMs (e.g., GPT-4o) in key information coverage and editing efficiency. End-to-end evaluation on high-activity Wikipedia pages demonstrates WiNELL's ability to identify and suggest timely factual updates. This opens up a promising research direction in LLM agents for automatically updating knowledge bases in a never-ending fashion.