MetFuse: Figurative Fusion between Metonymy and Metaphor
作者: Saptarshi Ghosh, Tianyu Jiang
分类: cs.CL
发布日期: 2026-04-14
备注: ACL 2026
🔗 代码/项目: GITHUB
💡 一句话要点
提出MetFuse数据集,研究隐喻和转喻的融合,并提升隐喻和转喻识别效果。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 隐喻 转喻 比喻融合 自然语言处理 数据集构建
📋 核心要点
- 现有计算方法通常孤立地研究转喻和隐喻,忽略了它们在自然语言中经常共现的现象。
- 论文提出了一个框架,可以将字面句子转化为转喻、隐喻和混合型三种比喻变体,从而研究它们的融合。
- 实验表明,使用MetFuse数据集扩充训练数据,可以持续提升转喻和隐喻的分类性能,尤其在转喻任务上提升显著。
📝 摘要(中文)
本文提出了一种框架,可以将字面意义的句子转换为三种比喻变体:转喻、隐喻和混合型。基于此框架,构建了MetFuse,这是第一个专门研究转喻和隐喻之间比喻融合的数据集,包含1000个经过人工验证的、语义对齐的四元组,共计4000个句子。在八个现有基准上的外部实验表明,使用MetFuse扩充训练数据能够持续改进转喻和隐喻的分类效果,其中混合型示例在转喻任务上产生了最大的增益。此外,本文还利用该数据集分析了一种比喻类型的存在如何影响另一种比喻类型。研究结果表明,与仅包含转喻的句子相比,人类标注者和大型语言模型在混合型句子中能更好地识别转喻,这表明隐喻的存在使转喻名词更加明确。该数据集已公开。
🔬 方法详解
问题定义:现有计算方法在处理隐喻和转喻时,通常将它们孤立地看待,忽略了两者在自然语言中经常同时出现并相互影响的现象。这导致模型无法充分理解和识别复杂的比喻表达,限制了自然语言处理的性能。
核心思路:论文的核心思路是通过构建一个包含字面句子及其对应的转喻、隐喻和混合型变体的数据集,来显式地建模和学习隐喻和转喻之间的关系。通过让模型同时接触不同类型的比喻表达,使其能够更好地理解和区分它们,从而提升识别能力。
技术框架:论文首先提出了一个将字面句子转换为三种比喻变体的框架。然后,基于该框架,构建了MetFuse数据集,该数据集包含1000个四元组,每个四元组包含一个字面句子及其对应的转喻、隐喻和混合型变体。最后,通过在现有基准数据集上进行实验,验证了MetFuse数据集的有效性。
关键创新:论文的关键创新在于提出了一个研究隐喻和转喻融合的框架,并构建了第一个专门用于此目的的数据集MetFuse。该数据集的独特之处在于它包含了字面句子及其对应的多种比喻变体,这使得研究者能够更深入地了解不同比喻类型之间的关系。
关键设计:MetFuse数据集的构建过程中,作者首先设计了一套规则,用于将字面句子转换为转喻、隐喻和混合型变体。然后,他们雇佣了人工标注者来验证这些变体的质量,并确保它们与原始字面句子在语义上保持一致。在实验中,作者使用了常见的文本分类模型,并使用MetFuse数据集来扩充训练数据。他们还分析了不同类型的比喻表达对模型性能的影响。
📊 实验亮点
实验结果表明,使用MetFuse数据集扩充训练数据,在八个现有基准数据集上,能够持续改进转喻和隐喻的分类效果。尤其是在转喻任务上,使用混合型示例进行训练,获得了最大的性能提升。这表明,同时学习隐喻和转喻能够帮助模型更好地理解和区分这两种比喻类型。
🎯 应用场景
该研究成果可应用于提升自然语言处理系统对复杂比喻语言的理解能力,例如情感分析、文本摘要和机器翻译等任务。通过更好地识别和理解隐喻和转喻,可以使这些系统更加准确和鲁棒,从而改善用户体验和提高工作效率。未来,该研究还可以扩展到其他类型的比喻表达,例如讽刺和反语。
📄 摘要(原文)
Metonymy and metaphor often co-occur in natural language, yet computational work has studied them largely in isolation. We introduce a framework that transforms a literal sentence into three figurative variants: metonymic, metaphoric, and hybrid. Using this framework, we construct MetFuse, the first dedicated dataset of figurative fusion between metonymy and metaphor, containing 1,000 human-verified meaning-aligned quadruplets totaling 4,000 sentences. Extrinsic experiments on eight existing benchmarks show that augmenting training data with MetFuse consistently improves both metonymy and metaphor classification, with hybrid examples yielding the largest gains on metonymy tasks. Using this dataset, we also analyze how the presence of one figurative type impacts another. Our findings show that both human annotators and large language models better identify metonymy in hybrid sentences than in metonymy-only sentences, demonstrating that the presence of a metaphor makes a metonymic noun more explicit. Our dataset is publicly available at: https://github.com/cincynlp/MetFuse.