The Big Three in Marriage Talk: LLM-Assisted Analysis of Moral Ethics and Sentiment on Weibo and Xiaohongshu

📄 arXiv: 2512.23609v1 📥 PDF

作者: Frank Tian-Fang Ye, Xiaozi Gao

分类: econ.GN, cs.CL

发布日期: 2025-12-29


💡 一句话要点

利用大语言模型分析微博和小红书上的婚姻话题,揭示道德伦理与情感倾向

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 社交媒体分析 婚姻态度 道德伦理 情感分析

📋 核心要点

  1. 中国结婚率显著下降,理解公众对婚姻的态度需要深入分析情感和道德因素。
  2. 本研究利用大语言模型分析社交媒体数据,识别情感倾向和道德伦理框架。
  3. 研究发现自主和社群伦理与负面婚姻态度相关,揭示了婚姻观念转变的深层原因。

📝 摘要(中文)

中国结婚登记数量急剧下降,从2013年的1347万对降至2024年的610万对。为了解公众对婚姻的态度,需要考察情感倾向以及评估背后的道德推理。本研究利用大型语言模型(LLM)辅助的内容分析方法,分析了来自中国两大社交媒体平台(新浪微博和小红书)的219358篇与婚姻相关的帖子。基于Shweder的“三大道德伦理”框架,对帖子进行情感(积极、消极、中性)和道德维度(自主、社群、神性)的编码。结果显示平台差异:微博上的讨论偏向积极,而小红书则以中性为主。两个平台上的大多数帖子都缺乏明确的道德框架。然而,当涉及道德伦理时,情感与道德之间存在显著关联。强调自主伦理和社群伦理的帖子大多为负面情绪,而以神性为框架的帖子则倾向于中性或积极情绪。这些发现表明,对个人自主约束和社群义务的担忧是当代中国消极婚姻态度的驱动因素。该研究展示了LLM在扩展定性分析方面的效用,并为制定具有文化敏感性的政策以应对中国婚姻数量下降的问题提供了见解。

🔬 方法详解

问题定义:本研究旨在理解中国社会对婚姻态度转变的深层原因,特别是情感倾向和道德伦理在其中的作用。现有方法难以大规模分析社交媒体上复杂的文本数据,无法有效捕捉用户的情感和道德观念。

核心思路:本研究的核心思路是利用大型语言模型(LLM)的强大文本理解能力,对社交媒体上的婚姻相关帖子进行内容分析,结合Shweder的“三大道德伦理”框架,从情感和道德两个维度剖析公众对婚姻的看法。通过量化分析不同道德框架下的情感倾向,揭示影响婚姻态度的关键因素。

技术框架:整体框架包括数据收集、预处理、LLM辅助的编码和统计分析四个阶段。首先,从新浪微博和小红书收集与婚姻相关的帖子。然后,对文本数据进行清洗和预处理。接着,利用LLM对帖子进行情感(积极、消极、中性)和道德维度(自主、社群、神性)的编码。最后,进行统计分析,探索情感和道德之间的关联。

关键创新:本研究的关键创新在于将LLM应用于大规模社交媒体文本的定性分析,并结合Shweder的道德伦理框架,实现了对婚姻态度更深入的理解。与传统的人工编码相比,LLM能够显著提高分析效率和一致性,并能捕捉到更细微的情感和道德差异。

关键设计:研究中使用了预训练的LLM模型(具体模型未知),并针对中文社交媒体文本进行了微调(具体微调方法未知)。情感分类和道德维度分类的具体prompt设计未知。统计分析中,采用了卡方检验等方法,检验不同道德框架下的情感分布是否存在显著差异。

📊 实验亮点

研究发现,微博上的婚姻讨论偏向积极,而小红书则以中性为主。更重要的是,当帖子涉及道德伦理时,自主和社群伦理与负面情感显著相关,而神性伦理则倾向于中性或积极情感。这些发现揭示了当代中国社会对婚姻态度的复杂性,以及道德观念在其中的重要作用。

🎯 应用场景

该研究成果可应用于社会学、人口学和传播学等领域,为政府制定相关政策提供参考。通过了解公众对婚姻的真实态度和潜在担忧,可以制定更具针对性的政策,以应对结婚率下降的问题。此外,该方法也可推广到其他社会议题的研究中,例如教育、医疗等。

📄 摘要(原文)

China's marriage registrations have declined dramatically, dropping from 13.47 million couples in 2013 to 6.1 million in 2024. Understanding public attitudes toward marriage requires examining not only emotional sentiment but also the moral reasoning underlying these evaluations. This study analyzed 219,358 marriage-related posts from two major Chinese social media platforms (Sina Weibo and Xiaohongshu) using large language model (LLM)-assisted content analysis. Drawing on Shweder's Big Three moral ethics framework, posts were coded for sentiment (positive, negative, neutral) and moral dimensions (Autonomy, Community, Divinity). Results revealed platform differences: Weibo discourse skewed positive, while Xiaohongshu was predominantly neutral. Most posts across both platforms lacked explicit moral framing. However, when moral ethics were invoked, significant associations with sentiment emerged. Posts invoking Autonomy ethics and Community ethics were predominantly negative, whereas Divinity-framed posts tended toward neutral or positive sentiment. These findings suggest that concerns about both personal autonomy constraints and communal obligations drive negative marriage attitudes in contemporary China. The study demonstrates LLMs' utility for scaling qualitative analysis and offers insights for developing culturally informed policies addressing marriage decline in Chinese contexts.