Extracting Consumer Insight from Text: A Large Language Model Approach to Emotion and Evaluation Measurement

作者: Stephan Ludwig, Peter J. Danaher, Xiaohao Yang, Yu-Ting Lin, Ehsan Abedin, Dhruv Grewal, Lan Du

分类: cs.CL, econ.EM

发布日期: 2026-02-17

💡 一句话要点

提出LX模型，用于从文本中精准提取消费者情感与评价指标，提升营销研究效率。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 情感分析 消费者评价 大型语言模型 微调 营销研究

📋 核心要点

现有方法难以准确测量消费者在非结构化文本中表达的情感和评价，这给营销研究带来了挑战。
论文提出Linguistic eXtractor (LX)模型，通过在消费者文本上进行微调，学习情感和评价之间的关联。
实验表明，LX模型在情感和评价指标提取方面显著优于GPT-4 Turbo等领先模型，提升了准确率。

📝 摘要（中文）

本研究提出了Linguistic eXtractor (LX)，一个在消费者文本上微调的大型语言模型，这些文本同时标注了消费者自报告的16种消费相关情感和4种评价结构：信任、承诺、推荐和情感倾向。LX始终优于包括GPT-4 Turbo、RoBERTa和DeepSeek在内的领先模型，在开放式调查回复中实现了81%的宏平均F1分数，在第三方标注的Amazon和Yelp评论中实现了超过95%的准确率。将LX应用于在线零售数据，使用看似无关回归证实了评论中表达的情感可以预测产品评分，而产品评分又可以预测购买行为。大多数情感影响都通过产品评分来调节，但某些情感（如不满和宁静）会直接影响购买，表明情感基调提供了超出星级评分的有意义的信号。为了支持其使用，提供了一个无需代码、免费的LX Web应用程序，从而能够对消费者撰写的文本进行可扩展的分析。通过为消费者感知测量建立新的方法论基础，本研究展示了利用大型语言模型推进营销研究和实践的新方法，从而实现了从消费者数据中验证营销结构的检测。

🔬 方法详解

问题定义：论文旨在解决从消费者撰写的文本中准确提取情感和评价指标的问题。现有方法，包括传统的情感分析方法和通用的大型语言模型，在处理特定领域的消费者文本时，精度和泛化能力不足，难以满足营销研究的需求。

核心思路：论文的核心思路是利用大型语言模型强大的语言理解能力，通过在特定领域的消费者文本上进行微调，使其能够更好地理解和识别消费者表达的情感和评价。通过有监督的学习，模型能够学习到文本内容与情感、评价指标之间的关联，从而实现更准确的提取。

技术框架：整体框架包括数据收集与标注、模型微调和模型评估三个主要阶段。首先，收集包含消费者情感和评价的文本数据，并进行人工或半自动标注。然后，选择一个预训练的大型语言模型作为基础模型，并在标注的数据集上进行微调，使其适应特定领域的任务。最后，使用独立的测试数据集评估模型的性能，并与其他模型进行比较。

关键创新：关键创新在于针对消费者情感和评价提取任务，对大型语言模型进行特定领域的微调。与直接使用通用的大型语言模型相比，这种方法能够更好地利用领域知识，提高模型的准确性和泛化能力。此外，论文还提供了一个无需代码的Web应用程序，方便用户使用该模型进行情感和评价分析。

关键设计：论文选择了一个预训练的大型语言模型作为基础模型，并使用交叉熵损失函数进行微调。具体的技术细节，如模型的具体架构、训练参数等，在论文中可能没有详细描述，属于未知信息。论文强调了数据集的质量和规模对模型性能的重要性，并使用了高质量的标注数据进行训练。

📊 实验亮点

LX模型在开放式调查回复中达到了81%的宏平均F1分数，显著优于GPT-4 Turbo、RoBERTa和DeepSeek等领先模型。在第三方标注的Amazon和Yelp评论数据集上，LX模型的准确率超过95%。通过看似无关回归分析，验证了评论中表达的情感能够有效预测产品评分和购买行为。

🎯 应用场景

该研究成果可广泛应用于市场调研、产品评价分析、消费者行为预测等领域。企业可以利用该模型分析消费者评论、社交媒体帖子等文本数据，了解消费者对产品或服务的真实情感和评价，从而改进产品设计、优化营销策略，提升客户满意度。该研究为营销研究提供了新的方法论基础。

📄 摘要（原文）

Accurately measuring consumer emotions and evaluations from unstructured text remains a core challenge for marketing research and practice. This study introduces the Linguistic eXtractor (LX), a fine-tuned, large language model trained on consumer-authored text that also has been labeled with consumers' self-reported ratings of 16 consumption-related emotions and four evaluation constructs: trust, commitment, recommendation, and sentiment. LX consistently outperforms leading models, including GPT-4 Turbo, RoBERTa, and DeepSeek, achieving 81% macro-F1 accuracy on open-ended survey responses and greater than 95% accuracy on third-party-annotated Amazon and Yelp reviews. An application of LX to online retail data, using seemingly unrelated regression, affirms that review-expressed emotions predict product ratings, which in turn predict purchase behavior. Most emotional effects are mediated by product ratings, though some emotions, such as discontent and peacefulness, influence purchase directly, indicating that emotional tone provides meaningful signals beyond star ratings. To support its use, a no-code, cost-free, LX web application is available, enabling scalable analyses of consumer-authored text. In establishing a new methodological foundation for consumer perception measurement, this research demonstrates new methods for leveraging large language models to advance marketing research and practice, thereby achieving validated detection of marketing constructs from consumer data.

Extracting Consumer Insight from Text: A Large Language Model Approach to Emotion and Evaluation Measurement

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理