Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions

作者: Xinnong Zhang, Wanting Shan, Hanjia Lyu, Zhongyu Wei, Jiebo Luo

分类: cs.CL, cs.MM, cs.SI

发布日期: 2026-06-04

💡 一句话要点

提出基于反事实上下文修订的框架以审计LLM立场模拟

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 立场模拟 上下文修订 多模态分析 社交媒体

📋 核心要点

现有的LLM立场模拟方法缺乏对用户特定信念的准确反映，且对对话上下文的变化敏感性未得到充分研究。
本研究提出了一种反事实上下文修订框架，通过控制对话上下文的修订来审计LLM的立场模拟效果。
实验结果表明，文本和多模态修订策略在立场转变的有效性和稳健性上均表现良好，提升了对立场动态的理解。

📝 摘要（中文）

大型语言模型（LLM）在模拟社交媒体用户及推测其对在线讨论的反应方面越来越普遍。然而，这些模拟是否准确反映用户特定信念，或对语义独立的对话上下文变化高度敏感仍不明确。本研究探讨了反事实上下文修订作为审计LLM立场模拟的框架。通过对原始在线对话进行分析，推断目标用户对特定话题的立场，并在修订后的上下文中再次模拟用户立场。我们比较了文本修订策略与结合基于表情包的多模态策略，并评估了平均立场转变方向和立场转变率两个主要有效性指标。结果显示，在不同的极化偏好机制下，文本和多模态策略均实现了有效且稳健的立场转变。我们的研究为理解LLM立场模拟的上下文敏感性提供了评估框架，同时强调了使用LLM模拟在线舆论动态的潜力与风险。

🔬 方法详解

问题定义：本研究旨在解决LLM在模拟用户立场时对上下文变化的敏感性问题。现有方法未能准确捕捉用户特定信念，导致模拟结果的可靠性不足。

核心思路：论文提出通过反事实上下文修订的方式，审计LLM的立场模拟。通过对原始对话进行修订，重新推断用户立场，从而评估上下文对立场的影响。

技术框架：整体流程包括三个主要阶段：首先，推断目标用户的初始立场；其次，应用控制修订策略修改对话上下文；最后，在修订后的上下文中重新模拟用户立场，并进行比较分析。

关键创新：本研究的创新点在于引入了反事实上下文修订作为审计工具，提供了一种新的视角来理解LLM立场模拟的上下文敏感性。这与传统方法的直接模拟不同，强调了上下文对立场的影响。

关键设计：在实验中，采用了文本修订和多模态修订策略，评估指标包括平均立场转变方向和立场转变率。多模态策略结合了表情包等视觉元素，增强了上下文的丰富性。

📊 实验亮点

实验结果显示，文本和多模态修订策略在立场转变方面均表现出显著的有效性，平均立场转变方向和立场转变率均有明显提升，尤其在多模态策略中，立场转变的稳健性得到了增强。这些结果为LLM在社交媒体中的应用提供了重要的实证支持。

🎯 应用场景

该研究的潜在应用领域包括社交媒体分析、在线舆论监测和自动化内容生成等。通过提供对LLM立场模拟的深入理解，能够帮助开发更为精准的舆论引导工具和社交媒体互动系统，提升用户体验和信息传播的有效性。

📄 摘要（原文）

Large language models are increasingly used to simulate social media users and infer how individuals may respond to online discussions. However, it remains unclear whether these simulations reflect precise user-specific beliefs or whether they are highly sensitive to semantically independent changes in conversational contexts. In this work, we study counterfactual context revision as a framework for auditing LLM-based stance simulation. Given an original online conversation, we first infer a target user's stance toward a specific topic. We then apply controlled revision strategies to the conversational context and simulate the user's stance again under the revised context. We compare text-only revision strategies with a multimodal one that incorporates meme-based context and evaluate two main effectiveness metrics, i.e., average directional stance shift and stance transition rate. The results reveal effective and robust stance transitions in both text-only and multimodal strategies across different polarization-preference mechanisms. Our study contributes an evaluation framework for understanding the context sensitivity of LLM-based stance simulation. More broadly, it highlights both the promise and risk of using LLMs to simulate online opinion dynamics.

Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理