ArPoMeme: An Annotated Arabic Multimodal Dataset for Political Ideology and Polarization

📄 arXiv: 2605.20967v1 📥 PDF

作者: Wajdi Zaghouani, Kais Attia, Md. Rafiul Biswas, Fadhl Eryani

分类: cs.CL

发布日期: 2026-05-20

备注: Accepted at LREC 2026 Main Conference


💡 一句话要点

ArPoMeme:一个带注释的阿拉伯语多模态数据集,用于政治意识形态和极化研究。

🎯 匹配领域: 支柱六:视频提取与匹配 (Video Extraction) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 阿拉伯语 政治模因 多模态分析 意识形态 政治极化 数据集 自然语言处理

📋 核心要点

  1. 阿拉伯语政治模因在网络政治讨论中占据重要地位,但缺乏系统性的资源来分析其多模态和意识形态维度。
  2. 论文提出了ArPoMeme数据集,通过半自动化的数据收集和人工标注,构建了一个包含多种意识形态的阿拉伯语政治模因数据集。
  3. 对数据集的分析揭示了不同意识形态群体在对抗性框架方面的不对称性,为研究政治极化提供了数据基础。

📝 摘要(中文)

本文介绍ArPoMeme,一个大规模的阿拉伯语政治模因数据集,包含约7300个模因,并按意识形态方向进行分类,包括左翼、伊斯兰主义、泛阿拉伯主义和讽刺视角。该数据集通过对生产和传播这些模因的公共Facebook页面和群组的自我识别进行分类,从而捕捉了阿拉伯语模因生态系统的多样性。为了确保规模和准确性,我们设计了一个半自动数据收集流程,结合了基于Playwright的Facebook抓取和Google Drive同步,然后使用Qwen2.5-VL-7B视觉语言模型进行文本提取。提取的文本经过人工验证,并针对三个极化维度进行注释:我们与他们的框架、对外群体的敌意以及行动号召。注释通过一个定制的基于Streamlit的界面进行,支持分布式标记、实时跟踪和版本控制。由此产生的数据集将视觉内容、文本信息和意识形态方向联系起来,从而能够对政治对抗、动员和幽默进行细粒度分析。对带注释语料库的定量分析表明,不同意识形态群体在对抗性框架方面存在强烈的不对称性,其中伊斯兰主义和讽刺模因表现出最高水平的敌意和动员线索。该数据集和注释工具为研究阿拉伯政治话语、多模态意识形态检测和极化动态提供了一个可重复且公开可用的资源。

🔬 方法详解

问题定义:现有方法缺乏对阿拉伯语政治模因的多模态和意识形态维度的系统性分析。缺乏大规模、带注释的数据集,阻碍了对阿拉伯语政治话语中极化现象的深入研究。现有方法难以有效捕捉模因中蕴含的复杂意识形态信息,以及不同意识形态群体之间的对抗性框架差异。

核心思路:论文的核心思路是构建一个大规模的、带注释的阿拉伯语政治模因数据集,并利用该数据集分析不同意识形态群体之间的对抗性框架差异。通过半自动化的数据收集和人工标注,确保数据集的规模和准确性。通过对模因的视觉内容、文本信息和意识形态方向进行关联,实现对政治对抗、动员和幽默的细粒度分析。

技术框架:整体框架包括以下几个主要阶段:1) 基于Playwright的Facebook数据抓取;2) 使用Google Drive进行数据同步;3) 使用Qwen2.5-VL-7B视觉语言模型进行文本提取;4) 人工验证和标注,标注维度包括Us vs. Them framing, Hostility toward out-groups, 和 Calls to action。标注过程使用基于Streamlit的定制界面,支持分布式标注、实时跟踪和版本控制。

关键创新:论文的关键创新在于构建了一个大规模的、带意识形态标注的阿拉伯语政治模因数据集。与现有方法相比,该数据集不仅包含了模因的视觉内容和文本信息,还包含了模因的意识形态方向和极化程度。此外,论文还设计了一个半自动化的数据收集和标注流程,提高了数据收集和标注的效率和准确性。

关键设计:数据收集方面,使用了Playwright进行自动化抓取,保证了数据获取的效率和覆盖范围。文本提取方面,使用了Qwen2.5-VL-7B视觉语言模型,提升了文本识别的准确率。标注界面方面,基于Streamlit构建,支持分布式标注,并提供实时跟踪和版本控制功能,保证了标注质量和效率。标注维度包括Us vs. Them framing, Hostility toward out-groups, 和 Calls to action,这些维度能够有效反映模因的极化程度。

📊 实验亮点

对ArPoMeme数据集的定量分析表明,不同意识形态群体在对抗性框架方面存在显著差异。伊斯兰主义和讽刺模因表现出最高的敌意和动员倾向。该数据集为研究阿拉伯政治话语、多模态意识形态检测和极化动态提供了一个宝贵的资源。

🎯 应用场景

该研究成果可应用于政治学、社会学、传播学等领域,用于分析阿拉伯世界的政治话语、意识形态传播和极化现象。该数据集可用于训练多模态意识形态检测模型,识别网络政治宣传和虚假信息。此外,该研究还可以帮助理解不同文化背景下的政治表达方式和幽默文化。

📄 摘要(原文)

Memes have become a prominent medium of political communication in the Arab world, reflecting how humor, imagery, and text interact to express ideological and cultural positions. Despite the centrality of memes to online political discourse, there is a lack of systematically curated resources for analyzing their multimodal and ideological dimensions in Arabic. This paper presents ArPoMeme, a large-scale dataset of approximately 7,300 Arabic political memes categorized by ideological orientation, including Leftist, Islamist, Pan-Arabist, and Satirical perspectives. The dataset captures the diversity of Arabic meme ecosystems by grounding classification in the self-identification of public Facebook pages and groups that produce and disseminate these memes. To ensure both scale and accuracy, we designed a semi-automated data collection pipeline combining Playwright-based Facebook scraping with Google Drive synchronization, followed by text extraction using the Qwen2.5-VL-7B vision language model. The extracted text was manually verified and annotated for three polarization dimensions: Us vs. Them framing, Hostility toward out-groups, and Calls to action. Annotation was conducted through a custom Streamlit-based interface supporting distributed labeling, real-time tracking, and version control. The resulting dataset links visual content, textual messages, and ideological orientation, enabling fine-grained analysis of political antagonism, mobilization, and humor. Quantitative analysis of the annotated corpus reveals strong asymmetries in antagonistic framing across ideological groups, with Islamist and satirical memes exhibiting the highest levels of hostility and mobilization cues. The dataset and the annotation tool offers a reproducible and publicly available resource for studying Arabic political discourse, multimodal ideology detection, and polarization dynamics.