Characterizing Knowledge Manipulation in a Russian Wikipedia Fork
作者: Mykola Trokhymovych, Oleksandr Kosovan, Nathan Forrester, Pablo Aragón, Diego Saez-Trumper, Ricardo Baeza-Yates
分类: cs.CL, cs.AI
发布日期: 2025-04-14 (更新: 2025-04-21)
💡 一句话要点
提出方法分析俄罗斯维基百科分支中的知识操控现象
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 知识操控 维基百科 内容分析 信息传播 社会科学 数据比较 主题分类
📋 核心要点
- 现有的维基百科分支在内容修改和知识操控方面缺乏系统的分析方法,导致对其影响的理解不足。
- 本文提出了一种比较分析方法,通过对比俄罗斯维基百科与其分支Ruwiki的内容,识别知识操控的主要形式。
- 研究结果显示,Ruwiki在多个主题上进行了显著的内容修改,为理解知识操控提供了新的视角和量化数据。
📝 摘要(中文)
维基百科由MediaWiki驱动,是许多其他基于维基的在线百科全书的基础设施。本文对新近推出的Ruwiki网站进行了深入分析,该网站复制并修改了原俄罗斯维基百科的内容,以符合俄罗斯法律。为识别与知识操控相关的实践和叙事,本文提出了一种方法论,比较分析了超过190万篇文章,探讨了Ruwiki编辑所做的更改,并对知识操控的主要主题进行了分类及其范围的数值估计。这项研究不仅揭示了Ruwiki内的重要变化,还提供了一种可应用于其他维基百科分支和类似协作项目的分析方法。
🔬 方法详解
问题定义:本文旨在解决对Ruwiki这一俄罗斯维基百科分支的知识操控现象缺乏深入分析的问题。现有方法未能系统识别和量化这些操控行为的具体形式和影响。
核心思路:论文通过对比分析原俄罗斯维基百科与Ruwiki的内容,提出了一种新的方法论,旨在揭示知识操控的主要主题及其范围。这样的设计使得研究者能够更清晰地理解内容修改的动机和影响。
技术框架:研究采用了综合比较分析的方法,涉及对超过190万篇文章的元信息、地理、时间、类别和文本特征的分析。主要模块包括数据收集、特征提取、内容比较和主题分类。
关键创新:最重要的技术创新在于提出了一种系统化的分析框架,能够量化和分类知识操控的主题,这在现有文献中尚属首次。与传统的定性分析方法相比,该方法提供了更为客观和可量化的结果。
关键设计:在参数设置上,研究采用了多种特征提取技术,确保了数据的全面性和准确性。损失函数设计上,重点关注了内容一致性和主题相关性,以提高分类的准确性。
🖼️ 关键图片
📊 实验亮点
研究表明,Ruwiki在多个主题上进行了显著的内容修改,尤其是在政治和历史相关条目中,知识操控的范围和影响得到了量化。这一分析方法的提出,为后续研究提供了新的工具和视角。
🎯 应用场景
该研究的潜在应用领域包括社会科学、信息传播和网络舆情分析等。通过提供一种系统化的分析方法,研究者可以更好地理解和应对知识操控现象,促进信息的透明性和公正性,未来可能对政策制定和社会治理产生积极影响。
📄 摘要(原文)
Wikipedia is powered by MediaWiki, a free and open-source software that is also the infrastructure for many other wiki-based online encyclopedias. These include the recently launched website Ruwiki, which has copied and modified the original Russian Wikipedia content to conform to Russian law. To identify practices and narratives that could be associated with different forms of knowledge manipulation, this article presents an in-depth analysis of this Russian Wikipedia fork. We propose a methodology to characterize the main changes with respect to the original version. The foundation of this study is a comprehensive comparative analysis of more than 1.9M articles from Russian Wikipedia and its fork. Using meta-information and geographical, temporal, categorical, and textual features, we explore the changes made by Ruwiki editors. Furthermore, we present a classification of the main topics of knowledge manipulation in this fork, including a numerical estimation of their scope. This research not only sheds light on significant changes within Ruwiki, but also provides a methodology that could be applied to analyze other Wikipedia forks and similar collaborative projects.