Why AI Harms Can't Be Fixed One Identity at a Time: What 5300 Incident Reports Reveal About Intersectionality

📄 arXiv: 2604.24519v1 📥 PDF

作者: Edyta Bogucka, Sanja Šćepanović, Daniele Quercia

分类: cs.CY, cs.AI, cs.HC

发布日期: 2026-04-27

备注: 29 pages, 7 figures

DOI: 10.1145/3805689.3812347


💡 一句话要点

揭示AI偏见:基于5300份事故报告的交叉性分析框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: AI偏见 交叉性 风险评估 事件报告分析 大型语言模型 身份识别 公平性 AI伦理

📋 核心要点

  1. 现有AI风险评估方法主要关注孤立的身份类别,忽略了身份交叉性带来的复合危害,导致评估结果不准确。
  2. 论文提出基于大规模AI事件报告分析的交叉性评估框架,利用LLM识别受害者身份,量化不同身份交叉点的危害程度。
  3. 实验结果表明,年龄和政治身份在AI危害中与种族和性别同等重要,特定身份交叉点(如青春期女孩)的危害显著放大。

📝 摘要(中文)

人工智能风险评估是识别AI系统造成危害的主要工具,包括交叉性危害,这种危害源于身份类别(如阶级和肤色)之间的相互作用,当这些类别被单独考虑时,这种危害不会发生或以不同方式发生。然而,现有的AI风险评估仍然围绕孤立的身份类别构建,并且当考虑交叉性时,几乎只关注种族和性别。通过对已记录的AI事件进行大规模分析,我们表明AI危害并非一次只发生在一个身份类别上。我们使用大型语言模型(LLM)应用结构化评估标准,分析了来自AI事件数据库中1200个已记录事件的5300份报告,该数据库是最受管理的事件数据来源。从这些报告中,我们识别出1513名受害主体及其相关的身份类别,准确率达到98%。在个体类别层面,我们发现年龄和政治身份在已记录的AI危害中出现的频率与种族和性别相当。在交叉类别层面,特定交叉点的危害被放大高达三倍:青春期女孩、下层有色人种和上层政治精英。我们认为,交叉性应该是AI风险评估的核心组成部分,以便更准确地捕捉危害是如何在社会群体中产生和分布的。

🔬 方法详解

问题定义:现有AI风险评估方法在识别AI系统造成的危害时,主要关注孤立的身份类别(如种族、性别),忽略了不同身份类别交叉作用产生的交叉性危害。这种方法无法准确捕捉到特定社会群体面临的复合风险,导致风险评估结果失真。现有方法也过度关注种族和性别,忽略了其他重要身份类别(如年龄、政治身份)的影响。

核心思路:论文的核心思路是通过大规模分析已记录的AI事件报告,识别受害者的身份信息,并量化不同身份类别及其交叉点上的危害程度。通过这种数据驱动的方法,揭示AI危害在不同社会群体中的分布情况,从而为更准确的AI风险评估提供依据。论文强调交叉性分析的重要性,认为这是全面评估AI危害的关键。

技术框架:论文的技术框架主要包括以下几个阶段:1)数据收集:从AI事件数据库中收集了1200个已记录事件的5300份报告。2)身份识别:使用大型语言模型(LLM)对报告进行分析,识别受害者的身份类别(如年龄、性别、种族、阶级、政治身份)。3)危害量化:统计不同身份类别及其交叉点上危害发生的频率,计算危害放大系数。4)结果分析:分析不同身份类别和交叉点上的危害分布情况,揭示AI危害的交叉性特征。

关键创新:论文的关键创新在于:1)提出了基于大规模AI事件报告的交叉性分析框架,为全面评估AI危害提供了一种新的方法。2)利用LLM自动识别受害者身份信息,提高了数据分析的效率和准确性。3)揭示了年龄和政治身份在AI危害中与种族和性别同等重要的地位,拓展了AI风险评估的关注范围。4)量化了特定身份交叉点上的危害放大效应,为制定更有针对性的风险缓解措施提供了依据。

关键设计:论文的关键设计包括:1)使用结构化的评估标准,指导LLM进行身份识别,确保结果的准确性和一致性。2)采用98%准确率的身份识别方法,保证了数据的可靠性。3)通过统计分析和可视化技术,清晰地展示了不同身份类别和交叉点上的危害分布情况。4)针对特定身份交叉点(如青春期女孩、下层有色人种)的危害放大效应,提出了有针对性的风险缓解建议。

📊 实验亮点

研究分析了5300份AI事件报告,识别出1513名受害主体,身份识别准确率高达98%。结果表明,年龄和政治身份在AI危害中与种族和性别同样重要。特定身份交叉点,如青春期女孩、下层有色人种和上层政治精英,面临的危害被放大高达三倍。这些发现强调了交叉性分析在AI风险评估中的重要性。

🎯 应用场景

该研究成果可应用于AI系统的风险评估和审计,帮助开发者和监管者识别潜在的偏见和歧视。通过关注身份交叉性,可以更准确地评估AI系统对不同社会群体的影响,从而制定更公平、更具包容性的AI设计和部署策略。研究结果还可以指导AI伦理教育和培训,提高从业者对AI偏见的认识和防范意识。

📄 摘要(原文)

AI risk assessment is the primary tool for identifying harms caused by AI systems. These include intersectional harms, which arise from the interaction between identity categories (e.g., class and skin tone) and which do not occur, or occur differently, when those categories are considered separately. Yet existing AI risk assessments are still built around isolated identity categories, and when intersections are considered, they focus almost exclusively on race and gender. Drawing on a large-scale analysis of documented AI incidents, we show that AI harms do not occur one identity category at a time. Using a structured rubric applied with a Large Language Model (LLM), we analyze 5,300 reports from 1,200 documented incidents in the AI Incident Database, the most curated source of incident data. From these reports, we identify 1,513 harmed subjects and their associated identity categories, achieving 98% accuracy. At the level of individual categories, we find that age and political identity appear in documented AI harms at rates comparable to race and gender. At the level of intersecting categories, harm is amplified up to three times at specific intersections: adolescent girls, lower-class people of color, and upper-class political elites. We argue that intersectionality should be a core component of AI risk assessment to more accurately capture how harms are produced and distributed across social groups.