Detecting Hate and Inflammatory Content in Bengali Memes: A New Multimodal Dataset and Co-Attention Framework

作者: Rakib Ullah, Mominul islam, Md Sanjid Hossain, Md Ismail Hossain

分类: cs.CL

发布日期: 2026-02-28

💡 一句话要点

提出MCFM模型和Bn-HIB数据集，用于检测孟加拉语Meme中的仇恨和煽动性内容

🎯 匹配领域: 支柱六：视频提取与匹配 (Video Extraction) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多模态融合 协同注意力 仇恨言论检测 孟加拉语 Meme分析

📋 核心要点

现有方法难以有效检测孟加拉语Meme中讽刺、微妙且具有文化特殊性的仇恨和煽动性内容。
论文提出多模态协同注意力融合模型（MCFM），通过协同注意力机制融合视觉和文本模态的关键特征。
实验表明，MCFM在新建的Bn-HIB数据集上显著优于现有模型，验证了其有效性。

📝 摘要（中文）

互联网 Meme 已成为社交媒体上的一种主要表达形式，孟加拉语社区也不例外。虽然 Meme 通常是幽默的，但它们也可能被利用来传播针对个人和群体的冒犯性、有害和煽动性内容。由于其讽刺性、微妙性和文化特殊性，检测此类内容极具挑战性。对于像孟加拉语这样的低资源语言来说，这个问题更加严重，因为现有的研究主要集中在高资源语言上。为了解决这个关键的研究空白，我们引入了 Bn-HIB (Bangla Hate Inflammatory Benign)，这是一个新的数据集，包含 3,247 个手动标注的孟加拉语 Meme，分为良性、仇恨或煽动性。重要的是，Bn-HIB 是第一个区分孟加拉语 Meme 中煽动性内容和直接仇恨言论的数据集。此外，我们提出了 MCFM (Multi-Modal Co-Attention Fusion Model)，一个简单而有效的架构，可以相互分析 Meme 的视觉和文本元素。MCFM 采用协同注意力机制来识别和融合来自每个模态的最关键特征，从而实现更准确的分类。我们的实验表明，MCFM 在 Bn-HIB 数据集上明显优于几种最先进的模型，证明了其在这种细微差别下的有效性。

🔬 方法详解

问题定义：论文旨在解决孟加拉语Meme中仇恨和煽动性内容的自动检测问题。现有方法主要集中在高资源语言上，且难以捕捉孟加拉语Meme中特有的讽刺、微妙和文化背景，导致检测效果不佳。此外，现有数据集通常无法区分煽动性内容和直接仇恨言论，限制了模型的细粒度识别能力。

核心思路：论文的核心思路是利用多模态信息融合，同时考虑Meme的视觉和文本内容。通过协同注意力机制，模型能够自动学习并关注不同模态中与仇恨/煽动性内容相关的关键特征，从而提高检测的准确性和鲁棒性。这种方法能够更好地理解Meme的整体语义，克服单一模态信息的局限性。

技术框架：MCFM模型主要包含以下几个模块：1) 文本编码器：用于提取Meme文本的特征表示；2) 图像编码器：用于提取Meme图像的特征表示；3) 协同注意力模块：用于计算文本和图像特征之间的注意力权重，从而突出关键特征；4) 特征融合模块：用于将文本和图像特征进行融合，得到最终的Meme表示；5) 分类器：用于根据Meme表示进行分类，判断其是否包含仇恨或煽动性内容。

关键创新：论文的关键创新在于提出了多模态协同注意力融合机制。与传统的特征拼接或简单融合方法不同，协同注意力机制能够动态地学习不同模态之间的关联性，并根据任务需求自适应地调整不同模态的权重。这种方法能够更有效地利用多模态信息，提高模型的泛化能力。此外，论文还构建了首个区分煽动性内容和直接仇恨言论的孟加拉语Meme数据集Bn-HIB。

关键设计：在文本编码器方面，可以使用预训练的孟加拉语语言模型，如BanglaBERT。图像编码器可以使用预训练的卷积神经网络，如ResNet。协同注意力模块可以使用标准的注意力机制，如Scaled Dot-Product Attention。损失函数可以使用交叉熵损失函数，并加入正则化项以防止过拟合。模型的训练可以使用Adam优化器，并设置合适的学习率和batch size。

🖼️ 关键图片

📊 实验亮点

实验结果表明，MCFM模型在Bn-HIB数据集上取得了显著的性能提升，超过了多个基线模型。具体而言，MCFM在准确率、精确率、召回率和F1值等指标上均取得了最佳表现，证明了其在孟加拉语Meme仇恨/煽动性内容检测方面的有效性。此外，协同注意力机制的可视化结果也表明，模型能够准确地关注到与仇恨/煽动性内容相关的关键区域。

🎯 应用场景

该研究成果可应用于社交媒体平台的内容审核，自动识别和过滤孟加拉语Meme中的仇恨和煽动性内容，从而维护健康的在线社区环境。此外，该方法也可推广到其他低资源语言和多模态内容分析任务中，具有广泛的应用前景。未来，可以进一步研究如何利用该技术来提高公众对网络仇恨言论的认知，并促进跨文化交流。

📄 摘要（原文）

Internet memes have become a dominant form of expression on social media, including within the Bengali-speaking community. While often humorous, memes can also be exploited to spread offensive, harmful, and inflammatory content targeting individuals and groups. Detecting this type of content is excep- tionally challenging due to its satirical, subtle, and culturally specific nature. This problem is magnified for low-resource lan- guages like Bengali, as existing research predominantly focuses on high-resource languages. To address this critical research gap, we introduce Bn-HIB (Bangla Hate Inflammatory Benign), a novel dataset containing 3,247 manually annotated Bengali memes categorized as Benign, Hate, or Inflammatory. Significantly, Bn- HIB is the first dataset to distinguish inflammatory content from direct hate speech in Bengali memes. Furthermore, we propose the MCFM (Multi-Modal Co-Attention Fusion Model), a simple yet effective architecture that mutually analyzes both the visual and textual elements of a meme. MCFM employs a co-attention mechanism to identify and fuse the most critical features from each modality, leading to a more accurate classification. Our experiments show that MCFM significantly outperforms several state-of-the-art models on the Bn-HIB dataset, demonstrating its effectiveness in this nuancedthis http URL: This work contains material that may be disturbing to some audience members. Viewer discretion is advised.

Detecting Hate and Inflammatory Content in Bengali Memes: A New Multimodal Dataset and Co-Attention Framework

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理