Marriage Discourse on Chinese Social Media: An LLM-assisted Analysis
作者: Frank Tian-Fang Ye, Xiaozi Gao
分类: econ.GN, cs.CL
发布日期: 2025-12-29 (更新: 2026-01-28)
💡 一句话要点
利用LLM分析中国社交媒体上的婚姻讨论,揭示情感与道德因素对结婚意愿的影响
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 社交媒体分析 婚姻态度 情感分析 道德伦理 内容分析 社会学研究
📋 核心要点
- 中国结婚率显著下降,需要深入理解影响婚姻态度的潜在因素,现有研究缺乏对社交媒体内容中情感和道德因素的系统分析。
- 本研究利用大型语言模型辅助的内容分析方法,从社交媒体帖子中提取情感和道德元素,分析它们与婚姻态度的关联。
- 研究发现,自主和社群相关的道德框架与负面情感相关,而神性相关的道德框架与正面情感相关,揭示了不同道德观念对婚姻态度的影响。
📝 摘要(中文)
中国结婚登记数量大幅下降,从2013年的1347万对降至2024年的610万对。本研究利用大型语言模型(LLM)辅助的内容分析方法,考察了来自微博和小红书的219358条婚姻相关帖子中蕴含的情感和道德因素。研究借鉴Shweder的“三大道德伦理”框架,对帖子进行情感(积极、消极、中性)和道德元素(自主、社群、神性)的编码。结果显示平台之间存在差异:微博倾向于积极情感,而小红书则以中性为主。大多数帖子缺乏明确的道德框架。然而,当道德元素被调用时,情感与道德元素之间存在显著关联。强调自主和社群的帖子主要为负面情感,而以神性为框架的帖子则倾向于积极情感。这些发现表明,对个人自主约束和社群义务的担忧是当代中国消极婚姻态度的原因,为制定具有文化敏感性的政策以应对结婚率下降提供了见解。
🔬 方法详解
问题定义:本研究旨在解决中国结婚率下降的社会问题,通过分析社交媒体上关于婚姻的讨论,探究影响婚姻态度的情感和道德因素。现有方法难以有效处理大规模社交媒体数据,并且缺乏对道德维度进行深入分析的框架。
核心思路:本研究的核心思路是利用大型语言模型(LLM)的文本理解和情感分析能力,对海量社交媒体数据进行自动化内容分析。同时,引入Shweder的“三大道德伦理”框架,从自主、社群和神性三个维度对帖子进行道德编码,从而更全面地理解婚姻态度的复杂性。
技术框架:整体框架包括数据收集、预处理、情感分析和道德编码四个主要阶段。首先,从微博和小红书收集婚姻相关的帖子数据。然后,对数据进行清洗和预处理。接着,利用LLM进行情感分析,将帖子分为积极、消极和中性三种情感。最后,基于“三大道德伦理”框架,利用LLM对帖子进行道德编码,识别帖子中蕴含的自主、社群和神性等道德元素。
关键创新:本研究的关键创新在于将大型语言模型与社会学理论相结合,实现对社交媒体内容的情感和道德维度的自动化分析。传统的内容分析方法依赖人工编码,效率低下且容易受到主观偏见的影响。而本研究利用LLM,可以高效地处理大规模数据,并提供更客观的分析结果。
关键设计:在情感分析和道德编码过程中,研究者使用了预训练的LLM模型,并通过少量人工标注数据进行微调,以提高模型的准确性和鲁棒性。具体而言,研究者可能使用了情感分类任务和文本分类任务,并采用了交叉熵损失函数进行模型训练。此外,研究者还可能设计了特定的提示工程(prompt engineering)策略,以引导LLM更好地理解和识别帖子中的情感和道德元素。
📊 实验亮点
研究结果表明,微博上的婚姻相关帖子更倾向于积极情感,而小红书则以中性为主。当帖子中涉及道德元素时,自主和社群相关的帖子更倾向于负面情感,而神性相关的帖子则更倾向于积极情感。这些发现揭示了不同平台用户对婚姻的不同态度,以及不同道德观念对婚姻态度的影响。
🎯 应用场景
该研究成果可应用于社会政策制定、婚姻咨询服务和舆情监测等领域。通过了解影响婚姻态度的情感和道德因素,政府可以制定更有效的政策来鼓励婚姻。婚姻咨询师可以更好地理解客户的价值观和情感需求,提供更个性化的服务。此外,该研究还可以用于监测社交媒体上关于婚姻的舆情,及时发现和应对潜在的社会问题。
📄 摘要(原文)
China's marriage registrations have declined substantially, dropping from 13.47 million couples in 2013 to 6.1 million in 2024. This study examined sentiment and moral elements underlying 219,358 marriage-related posts from Weibo and Xiaohongshu using large language model (LLM)-assisted content analysis. Drawing on Shweder's Big Three moral ethics framework, posts were coded for sentiment (positive, negative, neutral) and moral elements (autonomy, community, divinity). Results revealed platform differences: Weibo leaned toward positive sentiment, while Xiaohongshu was predominantly neutral. Most posts lacked explicit moral framing. However, when moral elements were invoked, significant associations with sentiment emerged. Posts invoking autonomy and community were predominantly negative, whereas divinity-framed posts tended toward positive sentiment. These findings suggest that concerns about both personal autonomy constraints and communal obligations contribute to negative marriage attitudes in contemporary China, offering insights for culturally informed policies addressing marriage decline.