The 2026 ACII Dyadic Conversations (DaiKon) Workshop & Challenge
作者: Panagiotis Tzirakis, Alice Baird, Jeffrey Brooks, Emilia Parada-Cabaleiro, Lukas Stappen, Sharath Rao, Theo Lebryk, Jakub Piotr Clapa, Jens Madsen
分类: cs.AI, cs.CL, cs.HC
发布日期: 2026-05-04
💡 一句话要点
ACII-DaiKon:用于建模对话情感与社交动态的双人对话基准挑战赛
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱五:交互与反应 (Interaction & Reaction) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 双人对话建模 人际影响预测 轮流预测 融洽关系建模 多模态分析 时间序列建模 情感计算
📋 核心要点
- 现有对话情感建模基准主要以说话者为中心,忽略了双人对话中重要的互动过程,如影响、协调和融洽关系。
- ACII-DaiKon挑战赛通过三个子挑战,即影响预测、轮流预测和融洽关系轨迹预测,来全面评估双人对话建模能力。
- 基线实验结果表明,现有方法在捕捉双人对话模式方面仍有提升空间,尤其是在方向性依赖和长时程动态建模方面。
📝 摘要(中文)
2026 ACII双人对话(ACII-DaiKon)研讨会与挑战赛引入了一个用于建模双人对话中人际情感和社会动态的基准。尽管对话情感建模已经快速发展,但大多数基准仍然以说话者为中心,并且低估了伙伴之间耦合的、随时间演变的过程,包括方向性影响、对话时间协调和融洽关系发展。为了解决这个差距,ACII-DaiKon提出了三个基于共享数据集的协调子挑战:(1)方向性人际影响预测,(2)轮流预测(下一个说话者和到下一个语音的时间),以及(3)跨完整交互的融洽关系轨迹预测。该挑战赛建立在Hume-DaiKon数据集上,该数据集包含945个双人对话(743.4小时的视听数据),这些数据是在五种语言的自然条件下收集的。该基准通过固定的训练/验证/测试分割、标准化指标和发布的基线系统,支持多模态建模、时间推理和跨上下文泛化。评估使用一致性相关系数(CCC)、Pearson相关性、宏F1和平均绝对误差(MAE),具体取决于子挑战。基线实验建立了初步的参考性能,影响预测的最佳测试结果为0.40 CCC和0.50 Pearson,轮流预测的最佳测试结果为0.66 Macro-F1和1.50秒MAE,融洽关系轨迹建模的最佳测试结果为0.68 CCC和0.70 Pearson。这些结果表明,虽然当前的方法可以捕捉到粗略的双人模式,但对方向性依赖和长时程人际动态的鲁棒建模仍然具有挑战性。该研讨会提供了一个共享平台,用于对数据有效性、评估协议和双人交互的文化感知建模进行严格比较和跨学科讨论。
🔬 方法详解
问题定义:现有对话情感建模方法主要关注个体说话者的情感,忽略了双人对话中个体之间的相互影响、时间协调以及关系发展等动态过程。这些动态过程对于理解对话的深层含义至关重要。现有方法难以捕捉这些细微而复杂的交互模式,导致对对话理解的局限性。
核心思路:ACII-DaiKon挑战赛的核心思路是提供一个基准,鼓励研究者开发能够建模双人对话中人际影响、轮流机制和融洽关系动态的模型。通过提供统一的数据集、评估指标和基线系统,促进不同方法之间的公平比较和有效改进。该挑战赛旨在推动对话情感建模从以说话者为中心向以交互为中心的转变。
技术框架:ACII-DaiKon挑战赛基于Hume-DaiKon数据集,包含945个双人对话,涵盖五种语言。挑战赛包含三个子挑战:1) 方向性人际影响预测:预测对话中个体对彼此的影响程度;2) 轮流预测:预测下一个说话者以及说话时间;3) 融洽关系轨迹预测:预测对话过程中融洽关系的演变轨迹。每个子挑战都提供了固定的训练/验证/测试集划分,以及相应的评估指标。
关键创新:ACII-DaiKon挑战赛的关键创新在于其关注双人对话中的人际动态,并提供了一个专门为此设计的基准数据集和评估框架。与以往主要关注个体情感的对话建模研究不同,该挑战赛鼓励研究者开发能够捕捉个体之间相互影响、时间协调和关系发展的模型。
关键设计:Hume-DaiKon数据集包含视听数据,支持多模态建模。评估指标包括一致性相关系数(CCC)、Pearson相关性、宏F1和平均绝对误差(MAE),根据子挑战的不同选择合适的指标。基线系统提供了初步的参考性能,为参与者提供了一个起点。
🖼️ 关键图片
📊 实验亮点
基线实验结果显示,影响预测的最佳测试结果为0.40 CCC和0.50 Pearson,轮流预测的最佳测试结果为0.66 Macro-F1和1.50秒MAE,融洽关系轨迹建模的最佳测试结果为0.68 CCC和0.70 Pearson。这些结果表明,现有方法在捕捉双人对话模式方面仍有提升空间,尤其是在方向性依赖和长时程动态建模方面。
🎯 应用场景
该研究成果可应用于人机交互、在线教育、心理咨询等领域。例如,在人机交互中,可以使机器人更好地理解人类的情感和意图,从而进行更自然和有效的交流。在在线教育中,可以帮助教师更好地了解学生的学习状态和情感需求,从而提供个性化的教学服务。在心理咨询中,可以辅助咨询师分析患者的对话,从而更准确地诊断病情和提供治疗方案。
📄 摘要(原文)
The 2026 ACII Dyadic Conversations (ACII-DaiKon) Workshop & Challenge introduces a benchmark for modeling interpersonal affect and social dynamics in dyadic conversations. Although conversational affect modeling has advanced rapidly, most benchmarks remain speaker-centric and underrepresent coupled, time-evolving processes between partners, including directional influence, conversational timing coordination, and rapport development. To address this gap, ACII-DaiKon presents three coordinated sub-challenges built on a shared dataset: (1) directional interpersonal influence prediction, (2) turn-taking prediction (next-speaker and time-to-next-speech), and (3) rapport trajectory prediction across full interactions. The challenge is built on the Hume-DaiKon dataset, comprising 945 dyadic conversations (743.4 hours of audiovisual data) collected under naturalistic conditions across five languages. The benchmark supports multimodal modeling, temporal reasoning, and cross-context generalization through fixed train/validation/test splits, standardized metrics, and released baseline systems. Evaluation uses Concordance Correlation Coefficient (CCC), Pearson correlation, Macro-F1, and Mean Absolute Error (MAE) depending on the sub-challenge. Baseline experiments establish initial reference performance, with best test results of 0.40 CCC and 0.50 Pearson for influence prediction, 0.66 Macro-F1 and 1.50~s MAE for turn-taking, and 0.68 CCC and 0.70 Pearson for rapport trajectory modeling. These results indicate that while current methods capture coarse dyadic patterns, robust modeling of directional dependence and long-horizon interpersonal dynamics remains challenging. The workshop provides a shared platform for rigorous comparison and cross-disciplinary discussion on data validity, evaluation protocols, and culturally aware modeling for dyadic interaction.