SVC 2026: the Second Multimodal Deception Detection Challenge and the First Domain Generalized Remote Physiological Measurement Challenge
作者: Dongliang Zhu, Zhiyi Niu, Bo Zhao, Jiajian Huang, Shuo Ye, Xun Lin, Hui Ma, Taorui Wang, Jiayu Zhang, Chunmei Zhu, Junzhe Cao, Yingjie Ma, Rencheng Song, Albert Clapés, Sergio Escalera, Dan Guo, Zitong Yu
分类: cs.CV
发布日期: 2026-04-07
备注: Accepted by the SVC workshop @ CVPR 2026
💡 一句话要点
SVC 2026:多模态欺骗检测与领域泛化远程生理测量挑战赛
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 细微视觉信号 欺骗检测 远程生理测量 多模态学习 领域泛化
📋 核心要点
- 现有方法在处理真实场景中微弱信号时,鲁棒性、表征能力和泛化性不足,难以有效检测和利用细微视觉信号。
- SVC 2026挑战赛旨在通过跨域多模态欺骗检测和远程生理测量两个任务,促进细微视觉信号鲁棒表征的学习。
- 共有22支队伍参与了本次挑战赛,提交了最终结果,并提供了相应的基线模型,为后续研究提供了基础。
📝 摘要(中文)
细微的视觉信号,虽然肉眼难以察觉,但包含着重要的信息,能够揭示视觉数据中隐藏的模式。这些信号在生物特征安全、多媒体取证、医学诊断、工业检测和情感计算等诸多应用中发挥着关键作用。随着计算机视觉和表征学习技术的快速发展,检测和解释这些细微信号已成为一个新兴的研究方向。然而,现有的研究通常侧重于特定的任务或模态,并且模型在处理真实环境中细微和微弱信号时,仍然面临着鲁棒性、表征能力和泛化性的挑战。为了促进该领域的研究,我们组织了Subtle visual Challenge,旨在学习对细微视觉信号的鲁棒表征。该挑战包括两个任务:跨域多模态欺骗检测和远程光电容积脉搏波(rPPG)估计。我们希望这项挑战能够鼓励开发更鲁棒和更具泛化性的细微视觉理解模型,并进一步推进计算机视觉和多模态学习的研究。共有22支队伍向本次研讨会竞赛提交了最终结果,相应的基线模型已在MMDD2026平台上发布。
🔬 方法详解
问题定义:论文旨在解决现有方法在处理真实环境中细微视觉信号时,鲁棒性、表征能力和泛化性不足的问题。现有方法通常针对特定任务或模态,难以应对复杂场景下的欺骗检测和生理信号测量,痛点在于缺乏跨域适应性和对微弱信号的敏感性。
核心思路:核心思路是通过组织挑战赛的形式,吸引研究者共同探索更鲁棒和泛化的模型。挑战赛包含两个任务:跨域多模态欺骗检测和远程光电容积脉搏波(rPPG)估计。通过竞赛,鼓励研究者提出新的算法和模型,提升模型在真实场景下的性能。
技术框架:整体框架围绕SVC 2026挑战赛展开,包括数据收集与标注、任务定义、评估指标设定、基线模型提供、参赛队伍提交结果以及结果分析等环节。挑战赛包含两个主要任务: 1. 跨域多模态欺骗检测:利用视觉、听觉等多模态信息,判断目标是否存在欺骗行为。 2. 远程光电容积脉搏波(rPPG)估计:通过摄像头捕捉面部视频,估计目标的心率等生理指标。
关键创新:关键创新在于将细微视觉信号的理解问题转化为一个公开的挑战赛,鼓励研究者探索新的方法和技术。通过跨域和多模态的设置,增加了任务的难度和挑战性,促使研究者关注模型的泛化能力和鲁棒性。
关键设计:挑战赛的具体设计包括: 1. 数据集:提供包含欺骗行为和生理信号的视频数据集,并进行详细标注。 2. 评估指标:针对欺骗检测任务,采用准确率、F1-score等指标;针对rPPG估计任务,采用均方误差、皮尔逊相关系数等指标。 3. 基线模型:提供基于现有方法的基线模型,供参赛者参考和比较。 4. 竞赛规则:制定公平、公正的竞赛规则,确保比赛的顺利进行。
🖼️ 关键图片
📊 实验亮点
本次SVC 2026挑战赛吸引了22支队伍参与,提交了各自的解决方案。挑战赛提供了基线模型,为参赛者提供了一个起点。通过对比参赛队伍的结果和基线模型,可以评估不同方法的性能和效果,为未来的研究提供参考。具体的性能数据和提升幅度需要在后续的比赛报告中进行详细分析。
🎯 应用场景
该研究成果可应用于多个领域,如安全监控、金融风控、招聘面试、在线教育等。通过检测欺骗行为,可以提高安全性和可信度。通过远程生理测量,可以实现非接触式健康监测,为医疗诊断和健康管理提供便利。未来,该技术有望在人机交互、智能家居等领域发挥更大的作用。
📄 摘要(原文)
Subtle visual signals, although difficult to perceive with the naked eye, contain important information that can reveal hidden patterns in visual data. These signals play a key role in many applications, including biometric security, multimedia forensics, medical diagnosis, industrial inspection, and affective computing. With the rapid development of computer vision and representation learning techniques, detecting and interpreting such subtle signals has become an emerging research direction. However, existing studies often focus on specific tasks or modalities, and models still face challenges in robustness, representation ability, and generalization when handling subtle and weak signals in real-world environments. To promote research in this area, we organize the Subtle visual Challenge, which aims to learn robust representations for subtle visual signals. The challenge includes two tasks: cross-domain multimodal deception detection and remote photoplethysmography (rPPG) estimation. We hope that this challenge will encourage the development of more robust and generalizable models for subtle visual understanding, and further advance research in computer vision and multimodal learning. A total of 22 teams submitted their final results to this workshop competition, and the corresponding baseline models have been released on the \href{https://sites.google.com/view/svc-cvpr26}{MMDD2026 platform}\footnote{https://sites.google.com/view/svc-cvpr26}