SMADE-IE: Sparse Multi-Agent Framework with Evidence-Driven Debate for Zero-Shot Information Extraction
作者: Kenfeng Huang, Yi Cai, Xin Wu, Zikun Deng, Li Yuan
分类: cs.CL
发布日期: 2026-06-03
备注: 21 pages, 9 figures
💡 一句话要点
提出SMADE-IE以解决零-shot信息提取中的多代理冲突问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 零-shot信息提取 多代理系统 证据驱动 自适应选择 贝叶斯更新 Toulmin模型 信息提取 模型效率
📋 核心要点
- 现有的零-shot信息提取方法存在边界和类型错误,以及跨类型冲突和冗余交互的问题。
- SMADE-IE通过自适应模式选择器和证据驱动的辩论机制,优化信息提取过程,减少推理噪声和冲突。
- 在9个基准数据集上,SMADE-IE在性能上超越了现有基线,并提高了令牌使用效率。
📝 摘要(中文)
零-shot信息提取(IE)利用大型语言模型(LLMs)在适应新模式和领域方面展现出灵活性,然而现有方法面临边界和类型错误、跨类型冲突及冗余交互等挑战。为此,本文提出SMADE-IE,一个稀疏且基于证据驱动的多代理框架。该框架通过自适应模式选择器动态路由输入,减少不必要的类型选择和推理噪声,并引入证据驱动的辩论机制,结构化论据并通过外部证据评分和贝叶斯更新进行置信度聚合。实验结果表明,SMADE-IE在9个基准数据集上表现优于现有零-shot IE基线,同时通过稀疏代理选择和早停辩论提高了令牌效率。
🔬 方法详解
问题定义:本文旨在解决零-shot信息提取中的多代理冲突和冗余交互问题。现有方法如单一提示和每类型提示在处理复杂信息时容易出现边界和类型错误。
核心思路:SMADE-IE的核心思路是通过自适应模式选择器动态选择合适的提取模式,结合证据驱动的辩论机制来处理冲突预测,从而提高信息提取的准确性和效率。
技术框架:SMADE-IE的整体架构包括两个主要模式:轻量级的全局提取模式和以类型为中心的提取模式。自适应模式选择器负责根据输入动态选择合适的模式,证据驱动的辩论机制则在预测冲突时进行论证和置信度聚合。
关键创新:SMADE-IE的创新之处在于引入了证据驱动的辩论机制,将论据结构化为Toulmin风格的组件,并通过外部证据评分和贝叶斯更新来聚合置信度,这一设计有效解决了现有方法中的冲突和冗余问题。
关键设计:在设计上,SMADE-IE采用了自适应模式选择器来减少不必要的类型选择,设置了特定的损失函数以优化置信度聚合过程,并通过稀疏代理选择和早停策略来提高令牌使用效率。
🖼️ 关键图片
📊 实验亮点
在9个基准数据集上,SMADE-IE在命名实体识别(NER)、关系提取(RE)和联合实体关系提取(JERE)任务上均表现优于现有零-shot信息提取基线,提升幅度显著,且通过稀疏代理选择和早停辩论提高了令牌效率。
🎯 应用场景
SMADE-IE在信息提取领域具有广泛的应用潜力,尤其是在需要快速适应新领域和模式的场景中,如法律文书分析、医疗记录提取和社交媒体信息监测等。其高效的处理能力和准确性将为相关行业带来显著的价值提升。
📄 摘要(原文)
Zero-shot information extraction (IE) with large language models (LLMs) has attracted increasing attention due to its flexibility in adapting to new schemas and domains without task-specific training. Existing approaches mainly rely on monolithic prompting, each-type prompting, or multi-agent debate. However, monolithic prompting often suffers from boundary and type errors, while each-type prompting and multi-agent debate introduce cross-type conflicts, redundant agent interactions, and substantial token overhead. To address these challenges, we propose SMADE-IE, a sparse and evidence-driven multi-agent framework for zero-shot IE. SMADE-IE first employs an Adaptive Mode Selector to dynamically route inputs into either a lightweight Global Extraction Mode or a Type-Centric Extraction Mode, reducing unnecessary type selection and reasoning noise. For conflicting predictions, we further introduce an Evidence-Driven Debate mechanism that structures arguments into Toulmin-style components and performs confidence aggregation through external evidence scoring and Bayesian updates. Experimental results on 9 benchmark datasets across NER, RE, and JERE tasks show that SMADE-IE consistently outperforms existing zero-shot IE baselines while also improving token efficiency through sparse agent selection and early-stopping debate.