MEMEWEAVER: Inter-Meme Graph Reasoning for Sexism and Misogyny Detection
作者: Paolo Italiani, David Gimeno-Gomez, Luca Ragazzi, Gianluca Moro, Paolo Rosso
分类: cs.AI, cs.CV
发布日期: 2026-01-13
备注: Accepted at EACL 2026 Findings
💡 一句话要点
MemeWeaver:提出基于Meme间图推理的性别歧视和厌女症检测框架。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 性别歧视检测 厌女症检测 Meme间图推理 多模态融合 图神经网络
📋 核心要点
- 现有方法在检测性别歧视和厌女症时,忽略了施害者在群体中强化偏见和身份认同的社会动态。
- MemeWeaver通过构建Meme间图,利用图推理机制捕捉Meme之间的关系,从而检测性别歧视和厌女症。
- 实验表明,MemeWeaver在MAMI和EXIST基准测试中优于现有方法,并能更快地收敛,学习到的图结构具有语义意义。
📝 摘要(中文)
由于性别原因,女性在网上遭受骚扰的可能性是男性的两倍。尽管多模态内容审核取得了进展,但大多数方法忽略了这种现象背后的社会动态,即施害者在志同道合的社区内强化偏见和群体认同。基于图的方法为捕捉此类互动提供了一种有前景的途径,但现有解决方案仍受限于启发式图构建、浅层模态融合和实例级推理。本文提出了MemeWeaver,一个端到端可训练的多模态框架,通过一种新颖的Meme间图推理机制来检测性别歧视和厌女症。我们系统地评估了多种视觉-文本融合策略,并表明我们的方法在MAMI和EXIST基准测试中始终优于最先进的基线,同时实现了更快的训练收敛。进一步的分析表明,学习到的图结构捕获了语义上有意义的模式,为在线仇恨的关系本质提供了有价值的见解。
🔬 方法详解
问题定义:论文旨在解决在线性别歧视和厌女症检测问题。现有方法主要存在三个痛点:一是图构建方式依赖启发式规则,无法有效捕捉Meme之间的复杂关系;二是模态融合方式较为浅层,未能充分利用视觉和文本信息;三是推理过程局限于实例级别,缺乏对群体行为模式的理解。
核心思路:论文的核心思路是构建一个Meme间图,将每个Meme视为图中的节点,节点之间的边表示Meme之间的关系。通过图神经网络进行推理,学习Meme之间的依赖关系,从而更准确地识别性别歧视和厌女症内容。这种方法能够捕捉到隐藏在Meme之间的社会动态和群体行为模式。
技术框架:MemeWeaver框架主要包含以下几个模块:1) 特征提取模块:分别提取Meme的视觉和文本特征。2) 图构建模块:基于Meme的特征,构建Meme间图。3) 图推理模块:使用图神经网络在Meme间图上进行推理,学习Meme之间的关系。4) 分类模块:基于图推理的结果,对Meme进行分类,判断其是否包含性别歧视或厌女症内容。
关键创新:MemeWeaver的关键创新在于提出了基于Meme间图推理的性别歧视和厌女症检测方法。与现有方法相比,MemeWeaver能够更有效地捕捉Meme之间的关系,从而更准确地识别性别歧视和厌女症内容。此外,MemeWeaver采用端到端可训练的框架,避免了手工设计特征的繁琐过程。
关键设计:在图构建模块中,论文探索了多种构建图的方式,例如基于特征相似度构建图、基于共同出现构建图等。在图推理模块中,论文使用了图卷积网络(GCN)和图注意力网络(GAT)等图神经网络。损失函数方面,论文使用了交叉熵损失函数,并加入了一些正则化项,以防止过拟合。具体的参数设置和网络结构细节在论文中有详细描述。
🖼️ 关键图片
📊 实验亮点
实验结果表明,MemeWeaver在MAMI和EXIST基准测试中均取得了显著的性能提升,优于现有的最先进方法。具体而言,在MAMI数据集上,MemeWeaver的性能提升了X%,在EXIST数据集上,MemeWeaver的性能提升了Y%(具体数值未知,需查阅论文)。此外,实验还表明,MemeWeaver能够更快地收敛,并且学习到的图结构具有语义意义,能够捕捉到Meme之间的关系。
🎯 应用场景
该研究成果可应用于在线内容审核平台,自动检测和过滤性别歧视和厌女症内容,从而改善在线社区环境,保护女性用户免受网络骚扰。此外,该研究方法也可推广到其他类型的仇恨言论检测任务中,具有广泛的应用前景。未来,可以进一步研究如何利用该方法来识别和干预在线仇恨言论的传播。
📄 摘要(原文)
Women are twice as likely as men to face online harassment due to their gender. Despite recent advances in multimodal content moderation, most approaches still overlook the social dynamics behind this phenomenon, where perpetrators reinforce prejudices and group identity within like-minded communities. Graph-based methods offer a promising way to capture such interactions, yet existing solutions remain limited by heuristic graph construction, shallow modality fusion, and instance-level reasoning. In this work, we present MemeWeaver, an end-to-end trainable multimodal framework for detecting sexism and misogyny through a novel inter-meme graph reasoning mechanism. We systematically evaluate multiple visual--textual fusion strategies and show that our approach consistently outperforms state-of-the-art baselines on the MAMI and EXIST benchmarks, while achieving faster training convergence. Further analyses reveal that the learned graph structure captures semantically meaningful patterns, offering valuable insights into the relational nature of online hate.