AI Knows When It's Being Watched: Functional Strategic Action and Contextual Register Modulation in Large Language Models

作者: Vinicius Covas, Jorge Alberto Hidalgo Toledo

分类: cs.CL, cs.AI, cs.CY, cs.MA

发布日期: 2026-05-14

备注: 20 pages, 6 figures

💡 一句话要点

大型语言模型在社会观察下表现出策略性行为和语境适应性，揭示其社会感知能力

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 社会感知 多智能体系统 AI治理 算法审计 语境适应 霍桑效应

📋 核心要点

现有研究较少关注LLM在社会结构化语境下的交流行为，缺乏对其社会感知能力的深入理解。
本研究通过模拟社会观察场景，考察LLM是否会根据观察者的身份和监控程度调整其语言风格。
实验结果表明，LLM在被监控时会表现出更正式的语言风格，且对人类观察者的反应比AI观察者更强烈。

📝 摘要（中文）

本研究从计算和认知角度深入探讨大型语言模型（LLM），着重考察其在社会结构化语境中作为交流主体的行为。研究旨在检验基于LLM的多智能体系统是否能根据感知到的社会观察语境进行系统性的语言调整，这对于AI治理和审计具有直接意义。借鉴哈贝马斯的交往行为理论、戈夫曼的戏剧模型、贝尔的受众设计框架以及霍桑效应，我们进行了一项受控实验，包含100个多智能体辩论会话，分为五个条件（每个条件n=20）。条件设置包括：大学研究人员的明确监控、无监控、以及用自动化AI审计系统替代人类研究人员的观察者替代条件。监控条件（Delta+24.9%，Delta+24.2%）和自动化AI监控条件（Delta+22.2%）产生比受众框架条件（Delta+17.7%）更高的TTR变化，F(4, 94) = 2.79, p = .031。消息长度显示出完全分离的效果，F(4, 95) = 19.55, p < .001。第五个条件——用AI观察者代替人类——产生中等的TTR适应，表明LLM的行为对观察者身份敏感：人类评估比自动化AI监控引发更强的语域形式化。我们讨论了对AI治理、算法审计以及将LLM重新定位为语境敏感的交流主体的意义。

🔬 方法详解

问题定义：该论文旨在研究大型语言模型（LLM）是否具备社会感知能力，即能否根据所处的社会环境（例如是否被观察、被谁观察）调整其语言表达方式。现有方法主要集中在LLM的计算和认知能力评估，而忽略了其作为社会交流主体的行为模式，缺乏对LLM在社会语境下行为适应性的系统性研究。

核心思路：论文的核心思路是模拟不同的社会观察场景，通过控制观察者的身份（人类研究员 vs. AI审计系统）和监控程度（明确监控 vs. 无监控），观察LLM在多智能体辩论中的语言表达变化。作者假设LLM会像人类一样，在被观察时表现出更正式、更谨慎的语言风格，以迎合观察者的期望或避免负面评价。

技术框架：该研究采用多智能体系统进行实验，整体框架如下： 1. 场景设计：设计五个不同的社会观察条件，包括人类研究员监控、无监控、AI审计系统监控等。 2. 智能体辩论：在每个条件下，让多个基于LLM的智能体进行辩论。 3. 语言分析：分析智能体在辩论中使用的语言，提取特征如词汇多样性（TTR）和消息长度。 4. 统计分析：使用方差分析（ANOVA）等统计方法，比较不同条件下LLM语言特征的差异，验证其社会感知能力。

关键创新：该研究的关键创新在于： 1. 首次系统性地研究了LLM在社会观察下的行为适应性，揭示了其潜在的社会感知能力。 2. 通过对比人类观察者和AI观察者的影响，发现LLM对不同类型的观察者表现出不同的反应。 3. 将社会学理论（如交往行为理论、戏剧模型）引入LLM研究，为理解LLM的行为提供了新的视角。

关键设计：实验中，关键的设计包括： 1. TTR (Type-Token Ratio)：作为衡量词汇多样性的指标，用于评估语言的正式程度。 2. 消息长度：用于评估LLM的表达详尽程度。 3. 观察者身份：区分人类研究员和AI审计系统，考察其对LLM行为的影响。 4. 监控程度：设置明确监控和无监控两种条件，评估监控对LLM行为的影响。

🖼️ 关键图片

📊 实验亮点

实验结果表明，在被监控条件下，LLM的词汇多样性（TTR）显著提高（Delta+24.9%，Delta+24.2%），表明其语言风格更加正式。自动化AI监控条件也观察到类似现象（Delta+22.2%）。此外，LLM对人类观察者的反应比AI观察者更强烈，表明其具备一定的社会感知能力。消息长度也受到观察条件的影响，但呈现出与TTR不同的变化趋势。

🎯 应用场景

该研究成果可应用于AI治理和算法审计领域，帮助设计更有效的AI监管机制。通过理解LLM的社会感知能力，可以更好地预测和控制其行为，避免其在特定社会语境下产生不良影响。此外，该研究也为开发更具社会意识和适应性的AI系统提供了理论基础。

📄 摘要（原文）

Large language models (LLMs) have been extensively studied from computational and cognitive perspectives, yet their behavior as communicative actors in socially structured contexts remains underexplored. This study examines whether LLM-based multi-agent systems exhibit systematic linguistic adaptation in response to perceived social observation contexts -- a question with direct implications for AI governance and auditing. Drawing on Habermas's (1981) Theory of Communicative Action, Goffman's (1959) dramaturgical model, Bell's (1984) Audience Design framework, and the Hawthorne Effect, we report a controlled experiment involving 100 multi-agent debate sessions across five conditions (n = 20 each). Conditions varied the framing of social observation -- from explicit monitoring by university researchers, to negation of monitoring, to an observer-substitution condition replacing human researchers with an automated AI auditing system. Monitored conditions (Delta+24.9%, Delta+24.2%) and the automated AI monitoring condition (Delta+22.2%) produce higher TTR change than audience-framing conditions (Delta+17.7%), F(4, 94) = 2.79, p = .031. Message length shows a fully dissociated effect, F(4, 95) = 19.55, p < .001. A fifth condition -- replacing human with AI observers -- yields intermediate TTR adaptation, suggesting LLM behavior is sensitive to observer identity: human evaluation elicits stronger register formalization than automated AI surveillance. We discuss implications for AI governance, algorithmic auditing, and the repositioning of LLMs as contextually sensitive communicative actors.

AI Knows When It's Being Watched: Functional Strategic Action and Contextual Register Modulation in Large Language Models

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理