Gaze-Aware AI: Mathematical modeling of epistemic experience of the Marginalized for Human-Computer Interaction & AI Systems
作者: Omkar Suresh Hatti
分类: cs.HC, cs.AI
发布日期: 2025-07-06
💡 一句话要点
提出Gaze Pressure Index (GPI)-Diff复合指标,用于量化边缘群体在人机交互中的认知体验。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 人机交互 人工智能伦理 边缘群体 凝视压力 大型语言模型
📋 核心要点
- 现有方法缺乏对边缘群体在人机交互中认知体验的量化分析,难以实现真正包容的人工智能系统。
- 论文提出Gaze Pressure Index (GPI)-Diff复合指标,旨在量化凝视对边缘群体自我表达的影响,并用于训练更具包容性的LLM。
- 通过分析Reddit帖子,验证了GPI-Diff指标的有效性,并提出了基于神经可塑性的肯定性和包容性人机交互原则。
📝 摘要(中文)
人工智能的普及为社会创造心理空间提供了机会。心理空间被定义为容纳多样化人际互动能力,是脆弱性的基础,进而产生真实性,最终导向亲社会行为和社会和谐。本文旨在量化人类下意识地修改真实自我表达以适应主流文化规范的现象。通过后现代哲学和心理学的概念,探讨了凝视在不同边缘化和交叉群体中的影响。通过分析一些经过编辑的Reddit帖子来研究凝视的影响,仅用于讨论而非认可。提出了Gaze Pressure Index (GPI)-Diff复合指标的数学公式,用于建模分析两个对话空间之间的关系。最终结果包括一个用于训练大型语言模型(LLM)的方程,以及基于该方程提出的肯定性和包容性人机交互的论点。该论点得到了神经可塑性(大脑的终身重塑能力)的几个原则的支持。
🔬 方法详解
问题定义:论文旨在解决边缘化群体在人机交互中,由于受到主流文化“凝视”压力,而被迫改变自身表达方式的问题。现有方法缺乏对这种“凝视”压力的量化,导致AI系统,特别是LLM,可能无意中强化了主流文化的偏见,从而损害了边缘化群体的利益。
核心思路:论文的核心思路是,通过量化边缘化群体在不同对话空间(例如,专门为边缘群体设计的安全空间 vs. 更广泛的公共空间)中的表达差异,来反映他们所感受到的“凝视”压力。这种差异被认为是对真实自我表达的一种扭曲,而量化这种扭曲程度可以帮助我们更好地理解和减轻这种压力。
技术框架:论文的技术框架主要包含以下几个步骤:1) 选择代表不同边缘化群体的Reddit帖子作为数据源;2) 将帖子分为两个集合,分别代表“安全空间”和“公共空间”;3) 使用自然语言处理技术分析两个集合中的文本,提取关键特征;4) 基于这些特征,计算Gaze Pressure Index (GPI)-Diff复合指标,该指标量化了两个集合之间的表达差异;5) 将GPI-Diff指标用于训练LLM,以期减少模型对边缘化群体的偏见。
关键创新:论文的关键创新在于提出了Gaze Pressure Index (GPI)-Diff复合指标,这是一个用于量化“凝视”压力的新颖方法。与以往的研究不同,该指标不仅关注于识别偏见,更关注于量化边缘化群体为了适应主流文化而做出的自我调整。
关键设计:论文的关键设计包括:1) 如何选择具有代表性的Reddit帖子;2) 如何定义“安全空间”和“公共空间”;3) 如何选择和提取文本特征,以准确反映表达差异;4) GPI-Diff指标的具体计算公式,以及如何将其融入LLM的训练过程中。具体的参数设置、损失函数、网络结构等技术细节在摘要中未提及,属于未知信息。
📊 实验亮点
论文提出了Gaze Pressure Index (GPI)-Diff复合指标,并将其应用于分析Reddit帖子,初步验证了该指标的有效性。虽然摘要中没有提供具体的性能数据或对比基线,但该研究为量化边缘群体在人机交互中的认知体验提供了一个新的思路和工具,为构建更具包容性的AI系统奠定了基础。
🎯 应用场景
该研究成果可应用于开发更具包容性和公平性的人工智能系统,尤其是在社交媒体、在线社区和客户服务等领域。通过量化和减轻边缘群体所感受到的“凝视”压力,可以促进更真实、更健康的在线互动,并减少AI系统对边缘群体的歧视。未来,该方法还可以扩展到其他领域,例如教育和医疗保健。
📄 摘要(原文)
The proliferation of artificial intelligence provides an opportunity to create psychological spaciousness in society. Spaciousness is defined as the ability to hold diverse interpersonal interactions and forms the basis for vulnerability that leads to authenticity that leads to prosocial behaviors and thus to societal harmony. This paper demonstrates an attempt to quantify, the human conditioning to subconsciously modify authentic self-expression to fit the norms of the dominant culture. Gaze is explored across various marginalized and intersectional groups, using concepts from postmodern philosophy and psychology. The effects of gaze are studied through analyzing a few redacted Reddit posts, only to be discussed in discourse and not endorsement. A mathematical formulation for the Gaze Pressure Index (GPI)-Diff Composite Metric is presented to model the analysis of two sets of conversational spaces in relation to one another. The outcome includes an equation to train Large Language Models (LLMs) - the working mechanism of AI products such as Chat-GPT; and an argument for affirming and inclusive HCI, based on the equation, is presented. The argument is supported by a few principles of Neuro-plasticity, The brain's lifelong capacity to rewire.