A Retail-Corpus for Aspect-Based Sentiment Analysis with Large Language Models
作者: Oleg Silcenco, Marcos R. Machad, Wallace C. Ugulino, Daniel Braun
分类: cs.CL
发布日期: 2025-08-25
备注: Accepted at ICNLSP 2025
💡 一句话要点
提出多语言零售评论数据集以提升基于方面的情感分析
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 情感分析 方面分析 多语言数据集 GPT-4 LLaMA-3 零售评论 机器学习 自然语言处理
📋 核心要点
- 现有的情感分析方法往往无法深入理解客户对特定方面的情感,导致分析结果的局限性。
- 本研究提出了一个手动标注的多语言数据集,并评估了GPT-4和LLaMA-3在基于方面的情感分析中的表现。
- 实验结果表明,GPT-4和LLaMA-3的准确率均超过85%,其中GPT-4在各项指标上表现更佳。
📝 摘要(中文)
基于方面的情感分析通过将情感检测与特定方面关联,提供比传统情感分析更深入的见解。本研究介绍了一个手动标注的数据集,包含10,814条多语言客户评论,涵盖实体零售店,并标注了八个方面类别及其情感。利用该数据集,评估了GPT-4和LLaMA-3在基于方面的情感分析中的表现,以建立新数据的基准。结果显示,两种模型的准确率均超过85%,其中GPT-4在所有相关指标上整体优于LLaMA-3。
🔬 方法详解
问题定义:本研究旨在解决传统情感分析无法有效关联特定方面的问题,现有方法缺乏针对性和深度,导致情感分析结果的局限性。
核心思路:通过构建一个包含多语言客户评论的手动标注数据集,论文旨在为基于方面的情感分析提供更丰富的语料支持,并评估先进语言模型的性能。
技术框架:研究首先收集并标注客户评论数据,随后利用GPT-4和LLaMA-3模型进行训练和评估,最后对模型的表现进行比较分析。
关键创新:本研究的创新在于引入了一个专门针对零售领域的多语言数据集,并通过与现有模型的对比,建立了新的性能基准。
关键设计:数据集包含10,814条评论,标注了八个方面类别,模型训练中采用了标准的交叉熵损失函数,确保了情感分类的准确性。实验中,GPT-4的表现优于LLaMA-3,显示出更强的情感识别能力。
📊 实验亮点
实验结果显示,GPT-4和LLaMA-3在基于方面的情感分析中均达到了超过85%的准确率,其中GPT-4在所有相关指标上表现优于LLaMA-3,展现了其在情感分析任务中的优势。
🎯 应用场景
该研究的成果可广泛应用于零售行业的客户反馈分析,帮助商家更好地理解客户对产品和服务的情感态度,从而优化产品和服务策略。此外,该数据集和模型评估方法也可为其他领域的情感分析提供参考,推动相关研究的发展。
📄 摘要(原文)
Aspect-based sentiment analysis enhances sentiment detection by associating it with specific aspects, offering deeper insights than traditional sentiment analysis. This study introduces a manually annotated dataset of 10,814 multilingual customer reviews covering brick-and-mortar retail stores, labeled with eight aspect categories and their sentiment. Using this dataset, the performance of GPT-4 and LLaMA-3 in aspect based sentiment analysis is evaluated to establish a baseline for the newly introduced data. The results show both models achieving over 85% accuracy, while GPT-4 outperforms LLaMA-3 overall with regard to all relevant metrics.