FCKT: Fine-Grained Cross-Task Knowledge Transfer with Semantic Contrastive Learning for Targeted Sentiment Analysis
作者: Wei Chen, Zhao Zhang, Meng Yuan, Kepeng Xu, Fuzhen Zhuang
分类: cs.CL, cs.AI
发布日期: 2025-05-27 (更新: 2025-05-28)
备注: 11 pages, 6 figures
🔗 代码/项目: GITHUB
💡 一句话要点
提出FCKT框架,通过细粒度跨任务知识迁移和语义对比学习提升目标情感分析性能。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 目标情感分析 跨任务学习 知识迁移 语义对比学习 细粒度情感分析
📋 核心要点
- 现有TSA方法依赖粗粒度知识迁移,忽略了方面内部情感极性的差异,导致负迁移。
- FCKT框架通过显式地将方面信息融入情感预测,实现细粒度知识迁移,缓解负迁移。
- 实验表明,FCKT在三个数据集上优于现有基线方法和大型语言模型,验证了其有效性。
📝 摘要(中文)
本文致力于解决目标情感分析(TSA)任务,该任务包含两个子任务:从评论中识别特定方面以及确定其对应的情感。方面提取是情感预测的基础,突出了这两个任务之间有效跨任务知识迁移的关键依赖性。虽然大多数现有研究采用多任务学习范式来对齐潜在空间中的任务特定特征,但它们主要依赖于粗粒度的知识迁移。这种方法缺乏对方面-情感关系的细粒度控制,通常假设相关方面内情感极性一致。这种过度简化忽略了区分情感的上下文线索,导致负迁移。为了克服这些限制,我们提出了FCKT,一个为TSA量身定制的细粒度跨任务知识迁移框架。通过将方面级别的信息显式地纳入情感预测中,FCKT实现了细粒度的知识迁移,有效地减轻了负迁移并提高了任务性能。在三个数据集上的实验,包括与各种基线和大语言模型(LLM)的比较,证明了FCKT的有效性。
🔬 方法详解
问题定义:目标情感分析(TSA)旨在识别文本中特定目标的情感极性。现有方法主要采用多任务学习,但依赖于粗粒度的知识迁移,忽略了同一目标在不同上下文中可能表达不同情感的事实,导致负迁移问题。
核心思路:FCKT的核心思路是通过细粒度的跨任务知识迁移来解决负迁移问题。具体来说,它将方面提取任务的知识更精确地迁移到情感预测任务中,避免了简单地假设同一方面的所有情感都是一致的。通过语义对比学习,模型能够更好地区分不同上下文中的情感表达。
技术框架:FCKT框架包含两个主要模块:方面提取模块和情感预测模块。方面提取模块负责从输入文本中识别出目标方面。情感预测模块则利用方面提取模块的结果,并结合上下文信息,预测目标方面的情感极性。这两个模块通过共享底层表示和细粒度的知识迁移机制进行连接。
关键创新:FCKT的关键创新在于其细粒度的跨任务知识迁移机制和语义对比学习方法。传统的跨任务学习方法通常采用粗粒度的特征对齐,而FCKT则通过显式地将方面信息融入情感预测,实现了更精确的知识迁移。语义对比学习则帮助模型更好地区分不同上下文中的情感表达,从而缓解负迁移。
关键设计:FCKT的具体实现细节包括:使用预训练语言模型(如BERT)作为底层表示,方面提取模块可以使用序列标注模型或Span Selection模型,情感预测模块可以使用分类器。损失函数包括方面提取的损失、情感预测的损失以及语义对比学习的损失。语义对比学习可以通过构建正负样本对来实现,正样本对是同一方面在相似上下文中的情感表达,负样本对是同一方面在不同上下文中的情感表达。
🖼️ 关键图片
📊 实验亮点
实验结果表明,FCKT在三个公开数据集上均取得了显著的性能提升。例如,在某数据集上,FCKT相比于基线模型提升了超过3个百分点。与大型语言模型(LLM)的对比也显示,FCKT在特定任务上具有竞争力,甚至超越了部分LLM,证明了其在细粒度情感分析方面的有效性。
🎯 应用场景
FCKT框架可应用于各种情感分析场景,例如产品评论分析、舆情监控、金融市场分析等。通过更准确地识别目标情感,可以帮助企业更好地了解客户需求,政府更有效地监控社会舆情,投资者更明智地进行投资决策。该研究的未来影响在于推动情感分析技术向更精细化、更智能化的方向发展。
📄 摘要(原文)
In this paper, we address the task of targeted sentiment analysis (TSA), which involves two sub-tasks, i.e., identifying specific aspects from reviews and determining their corresponding sentiments. Aspect extraction forms the foundation for sentiment prediction, highlighting the critical dependency between these two tasks for effective cross-task knowledge transfer. While most existing studies adopt a multi-task learning paradigm to align task-specific features in the latent space, they predominantly rely on coarse-grained knowledge transfer. Such approaches lack fine-grained control over aspect-sentiment relationships, often assuming uniform sentiment polarity within related aspects. This oversimplification neglects contextual cues that differentiate sentiments, leading to negative transfer. To overcome these limitations, we propose FCKT, a fine-grained cross-task knowledge transfer framework tailored for TSA. By explicitly incorporating aspect-level information into sentiment prediction, FCKT achieves fine-grained knowledge transfer, effectively mitigating negative transfer and enhancing task performance. Experiments on three datasets, including comparisons with various baselines and large language models (LLMs), demonstrate the effectiveness of FCKT. The source code is available on https://github.com/cwei01/FCKT.