Replicating Human Social Perception in Generative AI: Evaluating the Valence-Dominance Model

📄 arXiv: 2503.04842v1 📥 PDF

作者: Necdet Gurkan, Kimathi Njoki, Jordan W. Suchow

分类: cs.CL, cs.AI

发布日期: 2025-03-05


💡 一句话要点

评估Valence-Dominance模型,研究生成AI在人类社会感知上的复现能力

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 社会感知 生成AI 多模态学习 效价-支配性模型 主成分分析 人机交互 面部识别

📋 核心要点

  1. 现有AI系统在社会感知方面能力未知,能否复现人类社会认知模型是一个重要问题。
  2. 论文核心在于研究多模态生成AI能否重现人类社会感知的效价-支配性结构。
  3. 实验结果表明,AI系统在一定程度上可以复现人类社会感知,但也存在需要进一步研究的第三成分。

📝 摘要(中文)

随着人工智能,特别是生成模型的发展,一个开放的问题是这些系统是否能够复现人类社会感知的基本模型。社会认知中一个成熟的框架表明,社会判断是沿着两个主要维度组织的:效价(例如,信任度、温暖)和支配性(例如,权力、自信)。本研究考察了多模态生成AI系统在评估面部图像时,是否能够重现这种效价-支配性结构,以及它们的表征如何与世界各区域观察到的表征相一致。通过主成分分析(PCA),我们发现提取的维度与效价和支配性的理论结构非常相似,并且特质负荷与已建立的定义相符。然而,许多世界区域和生成AI模型也表现出第三个成分,其性质和意义值得进一步研究。这些发现表明,多模态生成AI系统可以复现人类社会感知的关键方面,从而引发了关于它们对AI驱动的决策和人机交互的影响的重要问题。

🔬 方法详解

问题定义:论文旨在研究生成式AI模型是否能够复现人类社会感知的核心维度,即效价(valence)和支配性(dominance)。现有方法缺乏对AI模型社会感知能力的系统性评估,无法确定AI是否以类似于人类的方式理解和判断社会属性。这对于AI在社会交往、决策制定等领域的应用至关重要。

核心思路:论文的核心思路是利用主成分分析(PCA)来提取生成式AI模型在处理面部图像时所产生的表征维度。通过将这些维度与人类社会感知的效价和支配性维度进行对比,评估AI模型是否能够捕捉到人类社会感知的基本结构。如果AI模型能够成功复现这些维度,则表明其具备一定的社会感知能力。

技术框架:研究的技术框架主要包括以下几个步骤:1. 使用多模态生成AI模型(具体模型未明确说明)处理面部图像数据集。2. 从AI模型的中间层提取表征向量。3. 对提取的表征向量进行主成分分析(PCA),以提取主要的维度。4. 将提取的维度与人类社会感知的效价和支配性维度进行对比,评估AI模型的社会感知能力。

关键创新:论文的关键创新在于将人类社会感知的理论框架(效价-支配性模型)应用于评估生成式AI模型的社会感知能力。通过这种方式,论文提供了一种系统性的方法来研究AI模型是否能够理解和判断社会属性,并为AI在社会交往、决策制定等领域的应用提供了新的视角。

关键设计:论文的关键设计包括:1. 选择合适的多模态生成AI模型,该模型需要能够处理面部图像并产生有意义的表征向量。2. 选择合适的面部图像数据集,该数据集需要包含足够多的面部图像,并且具有多样性。3. 使用主成分分析(PCA)来提取表征向量的主要维度。PCA的具体参数设置未知。4. 使用适当的指标来评估提取的维度与人类社会感知的效价和支配性维度之间的相似性。具体指标未知。

🖼️ 关键图片

fig_0

📊 实验亮点

研究发现,通过PCA提取的AI模型表征维度与人类社会感知的效价和支配性维度高度相关,表明AI在一定程度上能够复现人类的社会感知能力。然而,研究也发现存在第三个维度,其性质和意义有待进一步探索,暗示AI的社会感知可能存在与人类不同的方面。

🎯 应用场景

该研究成果可应用于提升人机交互的自然性和有效性,例如在社交机器人、虚拟助手等领域。通过使AI具备更准确的社会感知能力,可以改善用户体验,减少误解和冲突。此外,该研究还有助于评估AI在招聘、信贷评估等高风险决策场景中的公平性和偏见,促进AI的负责任发展。

📄 摘要(原文)

As artificial intelligence (AI) continues to advance--particularly in generative models--an open question is whether these systems can replicate foundational models of human social perception. A well-established framework in social cognition suggests that social judgments are organized along two primary dimensions: valence (e.g., trustworthiness, warmth) and dominance (e.g., power, assertiveness). This study examines whether multimodal generative AI systems can reproduce this valence-dominance structure when evaluating facial images and how their representations align with those observed across world regions. Through principal component analysis (PCA), we found that the extracted dimensions closely mirrored the theoretical structure of valence and dominance, with trait loadings aligning with established definitions. However, many world regions and generative AI models also exhibited a third component, the nature and significance of which warrant further investigation. These findings demonstrate that multimodal generative AI systems can replicate key aspects of human social perception, raising important questions about their implications for AI-driven decision-making and human-AI interactions.