Beyond Static Snapshots: Dynamic Modeling and Forecasting of Group-Level Value Evolution with Large Language Models

📄 arXiv: 2602.14043v1 📥 PDF

作者: Qiankun Pi, Guixin Su, Jinliang Li, Mayi Xu, Xin Miao, Jiawei Jiang, Ming Zhong, Tieyun Qian

分类: cs.SI, cs.AI

发布日期: 2026-02-15


💡 一句话要点

提出基于大语言模型的动态建模框架,预测群体价值观随时间演变

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 社会模拟 大语言模型 价值观预测 动态建模 群体异质性

📋 核心要点

  1. 现有基于大语言模型的社会模拟方法将群体价值观视为静态快照,忽略了其动态演变过程。
  2. 论文提出一种新框架,将历史价值观轨迹整合到大语言模型中,实现群体层面动态社会模拟。
  3. 实验结果表明,该方法在预测群体价值观演变方面显著优于现有方法,最高提升达33.97%。

📝 摘要(中文)

社会模拟对于挖掘复杂的社会动态和支持数据驱动的决策至关重要。基于大语言模型的方法通过利用类人的社会问卷回答来建模群体行为,已成为强大的工具。然而,现有的方法主要关注离散时间点的群体价值观,将其视为静态快照而非动态过程。群体价值观并非固定不变,而是受长期社会变化的影响。因此,对其动态性进行建模对于准确的社会演化预测至关重要,这是数据挖掘和社会科学中的一个关键挑战。由于纵向数据有限、群体异质性和复杂历史事件的影响,这个问题仍未得到充分探索。为了弥合这一差距,我们提出了一种新颖的群体层面动态社会模拟框架,通过将历史价值观轨迹整合到基于大语言模型的人类反应建模中。我们选择中国和美国作为代表性背景,在四个核心社会人口维度(性别、年龄、教育、收入)上进行分层模拟。利用世界价值观调查,我们构建了一个多波次的群体层面纵向数据集,以捕捉历史价值观的演变,然后提出了第一个基于事件的预测方法,将社会事件、当前价值观状态和群体属性统一到一个框架中。对五个大语言模型家族的评估显示出显著的收益:在已见问题上最大提高了30.88%,在未见问题上最大提高了33.97%(相比于Vanilla基线)。我们进一步发现显著的跨群体异质性:美国群体比中国群体更不稳定,两国年轻群体对外部变化更敏感。这些发现推进了基于大语言模型的社会模拟,并为社会科学家理解和预测社会价值观的变化提供了新的见解。

🔬 方法详解

问题定义:现有基于大语言模型的社会模拟方法主要关注群体在特定时间点的价值观,忽略了价值观随时间动态演变的过程。这种静态建模方式无法捕捉社会变迁的影响,导致预测精度不足。此外,群体异质性和历史事件的复杂影响也增加了建模的难度。

核心思路:论文的核心思路是将历史价值观轨迹融入到大语言模型中,从而使模型能够学习和预测群体价值观的动态演变。通过整合历史数据、社会事件和群体属性,模型可以更好地理解社会变迁对价值观的影响,并做出更准确的预测。

技术框架:该框架主要包含以下几个阶段:1) 数据收集与预处理:利用世界价值观调查等多波次纵向数据集,构建群体层面的历史价值观轨迹。2) 特征工程:提取社会事件、当前价值观状态和群体属性等特征。3) 模型构建:将提取的特征输入到大语言模型中,学习价值观的动态演变模式。4) 预测与评估:利用训练好的模型预测未来时间点的群体价值观,并与基线方法进行比较。

关键创新:该论文最重要的创新点在于提出了第一个基于事件的群体价值观动态预测方法。该方法将社会事件、当前价值观状态和群体属性统一到一个框架中,从而能够更全面地捕捉社会变迁对价值观的影响。此外,该研究还关注了群体异质性,并发现不同群体对外部变化的敏感程度存在差异。

关键设计:论文使用多波次的世界价值观调查数据,并对数据进行了分层抽样,以保证样本的代表性。在模型训练方面,论文采用了交叉验证等技术,以防止过拟合。此外,论文还设计了一系列评估指标,以全面评估模型的性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在已见问题上最大提高了30.88%,在未见问题上最大提高了33.97%(相比于Vanilla基线)。此外,研究还发现美国群体比中国群体更不稳定,两国年轻群体对外部变化更敏感。这些结果表明,该方法能够有效地捕捉群体价值观的动态演变,并为社会科学研究提供新的见解。

🎯 应用场景

该研究成果可应用于社会政策制定、市场营销、舆情分析等领域。通过预测群体价值观的演变趋势,政府可以制定更有效的社会政策,企业可以更好地了解消费者需求,舆情分析师可以更准确地把握社会舆论动向。此外,该研究还可以为社会科学家提供新的工具和方法,以研究社会变迁的规律。

📄 摘要(原文)

Social simulation is critical for mining complex social dynamics and supporting data-driven decision making. LLM-based methods have emerged as powerful tools for this task by leveraging human-like social questionnaire responses to model group behaviors. Existing LLM-based approaches predominantly focus on group-level values at discrete time points, treating them as static snapshots rather than dynamic processes. However, group-level values are not fixed but shaped by long-term social changes. Modeling their dynamics is thus crucial for accurate social evolution prediction--a key challenge in both data mining and social science. This problem remains underexplored due to limited longitudinal data, group heterogeneity, and intricate historical event impacts. To bridge this gap, we propose a novel framework for group-level dynamic social simulation by integrating historical value trajectories into LLM-based human response modeling. We select China and the U.S. as representative contexts, conducting stratified simulations across four core sociodemographic dimensions (gender, age, education, income). Using the World Values Survey, we construct a multi-wave, group-level longitudinal dataset to capture historical value evolution, and then propose the first event-based prediction method for this task, unifying social events, current value states, and group attributes into a single framework. Evaluations across five LLM families show substantial gains: a maximum 30.88\% improvement on seen questions and 33.97\% on unseen questions over the Vanilla baseline. We further find notable cross-group heterogeneity: U.S. groups are more volatile than Chinese groups, and younger groups in both countries are more sensitive to external changes. These findings advance LLM-based social simulation and provide new insights for social scientists to understand and predict social value changes.