Using Machine Learning to Enhance the Detection of Obfuscated Abusive Words in Swahili: A Focus on Child Safety
作者: Phyllis Nabangi, Abdul-Jalil Zakaria, Jema David Ndibwile
分类: cs.CL, cs.AI, cs.HC
发布日期: 2026-02-13
备注: Accepted at the Second IJCAI AI for Good Symposium in Africa, hosted by Deep Learning Indaba, 7 pages, 1 figure
💡 一句话要点
利用机器学习增强斯瓦希里语中混淆性辱骂词语的检测,关注儿童安全
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 斯瓦希里语 辱骂性词语检测 机器学习 数据增强 SMOTE 低资源语言 网络安全
📋 核心要点
- 现有方法在检测低资源语言(如斯瓦希里语)中经过混淆处理的辱骂性语言时面临挑战,主要是由于数据稀缺和语言资源有限。
- 本研究采用机器学习模型(SVM、逻辑回归、决策树)并结合SMOTE等技术,旨在提高斯瓦希里语辱骂性语言检测的准确性和鲁棒性。
- 实验结果表明,这些模型在检测混淆性语言方面表现出一定的性能,但数据集规模和不平衡性限制了结果的泛化能力。
📝 摘要(中文)
数字技术的兴起极大地增加了网络欺凌和在线辱骂的可能性,因此需要加强检测和预防措施,尤其是在儿童中。本研究侧重于检测斯瓦希里语中经过混淆处理的辱骂性语言,由于其有限的语言资源和技术支持,这种低资源语言带来了独特的挑战。选择斯瓦希里语是因为它在非洲非常流行,是非洲使用最广泛的语言,拥有超过1600万母语使用者和总共超过1亿的使用者,遍布东非地区和中东部分地区。我们采用了包括支持向量机(SVM)、逻辑回归和决策树在内的机器学习模型,通过严格的参数调整和诸如合成少数类过采样技术(SMOTE)等技术进行了优化,以处理数据不平衡问题。我们的分析表明,虽然这些模型在高维文本数据中表现良好,但我们数据集的小规模和不平衡性限制了我们发现的普遍性。我们彻底分析了精确率、召回率和F1分数,突出了每个模型在检测混淆性语言方面的细微性能。这项研究有助于更广泛地讨论如何确保儿童更安全的在线环境,倡导扩大数据集和先进的机器学习技术,以提高网络欺凌检测系统的有效性。未来的工作将侧重于增强数据的鲁棒性,探索迁移学习,并整合多模态数据,以创建更全面和对文化敏感的检测机制。
🔬 方法详解
问题定义:论文旨在解决斯瓦希里语中经过混淆处理的辱骂性词语检测问题。现有方法在低资源语言上表现不佳,主要原因是缺乏足够的标注数据,以及语言本身的复杂性导致难以有效识别混淆后的恶意表达。
核心思路:论文的核心思路是利用机器学习模型,结合数据增强技术,来克服斯瓦希里语辱骂性词语检测中数据稀缺的问题。通过训练模型学习辱骂性词语的特征,并利用SMOTE等方法平衡数据集,从而提高检测的准确率和召回率。
技术框架:整体流程包括数据收集与预处理、特征提取、模型训练与评估三个主要阶段。首先,收集斯瓦希里语文本数据,并进行清洗、分词等预处理操作。然后,提取文本特征,例如词袋模型、TF-IDF等。接着,使用支持向量机(SVM)、逻辑回归和决策树等机器学习模型进行训练,并使用SMOTE技术处理数据不平衡问题。最后,使用精确率、召回率和F1分数等指标评估模型的性能。
关键创新:论文的关键创新在于将机器学习方法应用于斯瓦希里语这种低资源语言的辱骂性词语检测,并针对数据不平衡问题采用了SMOTE等数据增强技术。这为其他低资源语言的自然语言处理任务提供了一种可行的解决方案。
关键设计:在模型训练过程中,论文采用了交叉验证方法来选择最优的参数。此外,SMOTE算法被用于生成新的少数类样本,以平衡数据集。具体参数设置未知,论文中可能未详细描述。
🖼️ 关键图片
📊 实验亮点
论文分析了SVM、逻辑回归和决策树等模型在斯瓦希里语辱骂性词语检测中的性能,并使用精确率、召回率和F1分数进行评估。虽然具体性能数据未在摘要中明确给出,但研究强调了数据集规模和不平衡性对模型泛化能力的影响,并指出了未来改进的方向。
🎯 应用场景
该研究成果可应用于在线社交平台、论坛等,用于自动检测和过滤斯瓦希里语中的辱骂性言论,从而为儿童和其他用户创造更安全的在线环境。此外,该方法也可以推广到其他低资源语言的文本审核和内容安全领域,具有重要的社会价值。
📄 摘要(原文)
The rise of digital technology has dramatically increased the potential for cyberbullying and online abuse, necessitating enhanced measures for detection and prevention, especially among children. This study focuses on detecting abusive obfuscated language in Swahili, a low-resource language that poses unique challenges due to its limited linguistic resources and technological support. Swahili is chosen due to its popularity and being the most widely spoken language in Africa, with over 16 million native speakers and upwards of 100 million speakers in total, spanning regions in East Africa and some parts of the Middle East. We employed machine learning models including Support Vector Machines (SVM), Logistic Regression, and Decision Trees, optimized through rigorous parameter tuning and techniques like Synthetic Minority Over-sampling Technique (SMOTE) to handle data imbalance. Our analysis revealed that, while these models perform well in high-dimensional textual data, our dataset's small size and imbalance limit our findings' generalizability. Precision, recall, and F1 scores were thoroughly analyzed, highlighting the nuanced performance of each model in detecting obfuscated language. This research contributes to the broader discourse on ensuring safer online environments for children, advocating for expanded datasets and advanced machine-learning techniques to improve the effectiveness of cyberbullying detection systems. Future work will focus on enhancing data robustness, exploring transfer learning, and integrating multimodal data to create more comprehensive and culturally sensitive detection mechanisms.