Contestable Multi-Agent Debate with Arena-based Argumentative Computation for Multimedia Verification

📄 arXiv: 2605.14495v1 📥 PDF

作者: Truong Thanh Hung Nguyen, Vo Thanh Khang Nguyen, Hoang-Loc Cao, Phuc Ho, Van Pham, Hung Cao

分类: cs.MM, cs.AI

发布日期: 2026-05-14

备注: ACM ICMR 2026 Grand Challenge on Multimedia Verification

DOI: 10.1145/3805622.3812606

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于竞技场论证计算的多智能体辩论框架,用于多媒体验证

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多媒体验证 多智能体系统 论证计算 可解释AI 大型语言模型 知识图谱 信息溯源

📋 核心要点

  1. 现有方法在多媒体验证中缺乏透明且可辩驳的推理过程,难以满足实际应用需求。
  2. 该方法利用多模态大语言模型和外部工具,构建基于竞技场的论证框架,实现可解释的验证过程。
  3. 该系统生成分段验证报告,具有透明、可编辑的特点,并适用于实际多媒体验证场景。

📝 摘要(中文)

多媒体验证不仅需要准确的结论,还需要透明且可辩驳的推理过程。本文提出了一种可辩驳的多智能体框架,该框架集成了多模态大型语言模型、外部验证工具和基于竞技场的定量双极论证(A-QBAF),作为对ICMR 2026多媒体验证大赛的投稿。该方法将每个案例分解为以声明为中心的多个部分,检索有针对性的证据,并将证据转换为具有来源和强度分数的结构化支持和攻击论证。这些论证通过小型局部论证图进行解决,并进行选择性的冲突解决和不确定性感知升级。最终系统生成分段验证报告,这些报告是透明的、可编辑的,并且在计算上适用于实际的多媒体验证。

🔬 方法详解

问题定义:多媒体验证任务需要提供准确的结论,同时也要保证推理过程的透明性和可辩驳性。现有方法往往缺乏对推理过程的解释,难以让用户理解验证结果的可信度,也难以进行有效的质疑和修正。这限制了多媒体验证技术在实际场景中的应用。

核心思路:论文的核心思路是将多媒体验证问题转化为一个多智能体辩论的过程。每个智能体负责收集证据、构建论证,并通过竞技场式的论证计算来解决冲突,最终达成共识。这种方法能够将复杂的验证过程分解为多个可解释的步骤,并允许用户参与到论证过程中,从而提高验证结果的透明性和可信度。

技术框架:整体框架包含以下几个主要模块:1) 案例分解模块:将每个多媒体验证案例分解为以声明为中心的多个部分。2) 证据检索模块:针对每个声明,检索相关的证据。3) 论证构建模块:将证据转换为结构化的支持和攻击论证,并赋予来源和强度分数。4) 论证解决模块:通过小型局部论证图,利用A-QBAF进行冲突解决和不确定性感知升级。5) 报告生成模块:生成分段验证报告,展示验证过程和结果。

关键创新:该方法最重要的创新点在于将多媒体验证问题转化为一个可辩驳的多智能体辩论过程,并引入了基于竞技场的定量双极论证(A-QBAF)框架。与传统的黑盒模型相比,该方法能够提供透明、可解释的推理过程,并允许用户参与到论证过程中。此外,该方法还考虑了证据的不确定性,并采用不确定性感知升级策略,提高了验证结果的鲁棒性。

关键设计:A-QBAF框架是该方法的核心。该框架定义了论证之间的支持和攻击关系,并采用定量的方式来评估论证的强度。通过竞技场式的论证计算,可以有效地解决论证之间的冲突,并最终确定每个声明的真伪。此外,该方法还设计了选择性的冲突解决策略,只解决对最终结果影响较大的冲突,从而提高计算效率。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

论文提出了一个集成了多模态大语言模型、外部验证工具和A-QBAF的完整框架,并开源了代码。实验结果(虽然摘要中未明确提及具体数值,但暗示了该方法在ICMR 2026多媒体验证大赛中具有竞争力)表明,该方法能够生成透明、可编辑且计算上可行的分段验证报告,适用于实际的多媒体验证场景。该框架为多媒体验证提供了一种新的、可解释的解决方案。

🎯 应用场景

该研究成果可应用于新闻媒体的假新闻检测、社交媒体的内容审核、以及司法领域的证据验证等场景。通过提供透明且可辩驳的验证过程,该方法能够提高多媒体验证结果的可信度,并帮助用户更好地理解和评估信息的真实性。未来,该方法还可以扩展到其他需要可解释推理的领域,例如医疗诊断和金融风险评估。

📄 摘要(原文)

Multimedia verification requires not only accurate conclusions but also transparent and contestable reasoning. We propose a contestable multi-agent framework that integrates multimodal large language models, external verification tools, and arena-based quantitative bipolar argumentation (A-QBAF) as a submission to the ICMR 2026 Grand Challenge on Multimedia Verification. Our method decomposes each case into claim-centered sections, retrieves targeted evidence, and converts evidence into structured support and attack arguments with provenance and strength scores. These arguments are resolved through small local argument graphs with selective clash resolution and uncertainty-aware escalation. The resulting system generates section-wise verification reports that are transparent, editable, and computationally practical for real-world multimedia verification. Our implementation is public at: https://github.com/Analytics-Everywhere-Lab/MV2026_the_liems.