Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor
作者: Yuxi Ma, Yongqian Peng, Junchen Lyu, Chi Zhang, Yixin Zhu
分类: cs.CL
发布日期: 2026-04-30
备注: to be published in CogSci 2026
💡 一句话要点
提出双重预测违背框架,揭示时间结构在幽默理解中的关键作用
🎯 匹配领域: 支柱六:视频提取与匹配 (Video Extraction)
关键词: 幽默理解 时间结构 语义不协调 预测违背 单口喜剧
📋 核心要点
- 现有幽默理论主要关注语义不协调,忽略了时间结构在幽默理解中的作用,未能解释“时机就是一切”的现象。
- 论文提出双重预测违背(DPV)框架,将语义违背和时间结构相结合,分析它们在幽默欣赏中的相互作用。
- 实验结果表明,时间特征比语义不协调更能预测观众的欣赏度,并且停顿时间与妙语的惊喜程度相关。
📝 摘要(中文)
幽默是一种基本的认知现象,人们通过违反预期并解决预期违反而获得愉悦,这体现了大脑进行预测处理的动态能力。经典的幽默理论强调语义不协调是引发幽默的主要因素,但忽略了时间动态,尽管喜剧演员的直觉是“时机就是一切”。时间结构在多大程度上促进了幽默的欣赏,以及它如何与语义内容相互作用,仍然知之甚少。本文提出了双重预测违背(DPV)框架来捕捉内容和时间之间的相互作用。通过分析828场专业的中文单口喜剧表演,我们表明时间特征在预测观众欣赏度方面大大超过了语义不协调。具体来说,我们发现语义违背的峰值比平均不协调水平更重要,并且在高度令人惊讶的妙语之前,停顿会系统性地延长——这种策略性耦合区分了成功和不成功的表演。这些发现将幽默重新定义为时间支架,其中时间和语义内容以策略性协调的方式运作,而不是独立运作。我们的DPV框架将幽默理论与预测处理联系起来,表明时间结构在自然幽默欣赏中起着核心作用,并对理解语言处理中的多尺度预测整合具有重要意义。
🔬 方法详解
问题定义:现有幽默理论主要关注语义不协调,而忽略了时间结构的重要性。喜剧演员的经验表明“时机就是一切”,但缺乏对时间结构如何影响幽默欣赏的深入研究。因此,该论文旨在研究时间结构在幽默理解中的作用,以及它与语义内容之间的相互作用。
核心思路:论文的核心思路是提出一个双重预测违背(DPV)框架,该框架将语义违背和时间结构相结合,认为幽默的产生是语义和时间共同作用的结果。通过分析单口喜剧表演,研究语义违背的程度和停顿时间等时间特征如何影响观众的欣赏度。
技术框架:该研究的技术框架主要包括以下几个步骤:1) 数据收集:收集了828场专业的中文单口喜剧表演的音频和文本数据。2) 特征提取:提取语义不协调程度和停顿时间等特征。语义不协调程度通过分析文本的语义差异来衡量。停顿时间通过分析音频数据来提取。3) 模型构建:构建回归模型,以观众的欣赏度(例如,笑声的频率和强度)为因变量,以语义不协调程度和停顿时间等特征为自变量。4) 模型评估:评估模型的预测性能,并分析不同特征对观众欣赏度的影响。
关键创新:该论文的关键创新在于提出了双重预测违背(DPV)框架,该框架将时间结构纳入幽默理解的范畴。与传统的幽默理论只关注语义不协调不同,DPV框架认为时间和语义内容是相互协调的,共同影响幽默的产生。此外,该研究还发现,语义违背的峰值比平均不协调水平更重要,并且在高度令人惊讶的妙语之前,停顿会系统性地延长。
关键设计:在特征提取方面,论文采用了多种方法来衡量语义不协调程度,例如,计算文本的语义向量之间的距离。在模型构建方面,论文采用了回归模型,并使用了交叉验证等技术来评估模型的泛化能力。此外,论文还对停顿时间进行了精细的分析,例如,研究了停顿时间与妙语的惊喜程度之间的关系。
🖼️ 关键图片
📊 实验亮点
研究发现,时间特征在预测观众欣赏度方面比语义不协调更重要。具体而言,语义违背的峰值比平均不协调水平更具影响力,并且在高度令人惊讶的妙语之前,停顿时间会显著延长。这些发现表明,时间结构在幽默欣赏中起着至关重要的作用。
🎯 应用场景
该研究成果可应用于开发更智能的幽默生成系统,例如,可以根据时间结构和语义内容生成更具吸引力的笑话和段子。此外,该研究还可以应用于情感计算、人机交互等领域,例如,可以利用时间特征来识别和理解人类的情感状态。
📄 摘要(原文)
Humor is a fundamental cognitive phenomenon in which humans derive pleasure from the expectation violations and their resolution, exemplifying the brain's dynamic capacity for predictive processing. Classical humor theories emphasize semantic incongruity as the primary driver of amusement, yet overlook temporal dynamics despite comedians' intuition that "timing is everything." The extent to which temporal structure contributes to humor appreciation and how it interacts with semantic content remains poorly understood. Here, we propose the Dual Prediction Violation (DPV) framework to capture the interplay between content and timing. By analyzing 828 professional Chinese stand-up performances, we show that temporal features substantially outweigh semantic incongruity in predicting audience appreciation. Specifically, we find that peak semantic violations matter more than average incongruity levels, and pauses systematically lengthen before high-surprise punchlines--a strategic coupling that distinguishes successful from unsuccessful performances. These findings reframe humor as temporally scaffolded, where timing and semantic content operate in strategic coordination rather than independently. Our DPV framework bridges humor theory with predictive processing, demonstrating that temporal structure plays a central role in naturalistic humor appreciation with implications for understanding multi-scale prediction integration in linguistic processing.