Representation Learning to Study Temporal Dynamics in Tutorial Scaffolding

📄 arXiv: 2603.24535v1 📥 PDF

作者: Conrad Borchers, Jiayi Zhang, Ashish Gurung

分类: cs.CL, cs.CY

发布日期: 2026-03-25

备注: Accepted as short paper to the 27th International Conference on Artificial Intelligence in Education (AIED 2026)


💡 一句话要点

提出基于嵌入的表征学习方法,分析辅导对话中的时间动态支架。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 表征学习 自适应支架 辅导对话 语义对齐 教育数据挖掘

📋 核心要点

  1. 现有方法难以在真实的辅导对话中有效衡量自适应支架,限制了对教学过程的深入理解。
  2. 论文提出一种基于嵌入的表征学习方法,通过语义对齐分析辅导对话中的支架动态。
  3. 实验表明,角色特定的语义对齐能够预测辅导进展,并揭示了导师和学生在任务对齐上的差异。

📝 摘要(中文)

自适应支架能够提升学习效果,但该领域缺乏在真实辅导对话中衡量它的有效方法。随着远程人工辅导和基于大型语言模型的系统的兴起,这一差距变得更加紧迫。我们提出了一种基于嵌入的方法,通过对齐对话轮次、问题陈述和正确答案的语义来分析支架动态。具体而言,我们通过计算导师和学生贡献以及任务相关内容之间的余弦相似度来实现对齐。我们将此框架应用于来自Eedi Question Anchored Tutoring Dialogues数据集的1576个真实数学辅导对话。分析揭示了任务对齐方面的系统性差异,以及参与者如何将他们的贡献建立在问题和解决方案内容中的不同时间模式。此外,混合效应模型表明,角色特定的语义对齐可以预测辅导进展,超越了消息顺序和长度等基线特征。导师的贡献在互动早期表现出更强的对问题内容的依赖。相比之下,学生解决方案对齐与进展略有正相关。这些发现支持将支架视为一个持续的、角色敏感的、基于任务语义的过程。通过捕获随时间变化的角色特定对齐,该方法为分析教学对话和评估会话辅导系统提供了一种原则性方法。

🔬 方法详解

问题定义:论文旨在解决如何有效衡量和分析真实辅导对话中的自适应支架问题。现有方法难以捕捉对话中细微的语义关联和时间动态,无法准确评估支架的有效性,也难以指导对话式辅导系统的设计。

核心思路:论文的核心思路是通过学习对话轮次、问题陈述和正确答案的语义表征,并计算它们之间的相似度(即对齐程度)来量化支架动态。这种方法假设有效的支架表现为导师和学生贡献与任务相关内容之间的高度语义对齐。

技术框架:整体框架包含以下步骤:1) 使用预训练语言模型(如BERT)将对话轮次、问题陈述和正确答案编码为嵌入向量。2) 计算导师和学生贡献与问题陈述、正确答案之间的余弦相似度,作为语义对齐的度量。3) 使用混合效应模型分析语义对齐与辅导进展之间的关系,控制消息顺序和长度等基线特征。4) 分析不同角色(导师和学生)在不同时间段内的语义对齐模式。

关键创新:论文的关键创新在于将表征学习和语义对齐的概念引入到辅导对话分析中,提出了一种量化支架动态的新方法。与传统方法相比,该方法能够更准确地捕捉对话中的语义关联,并揭示角色特定的时间模式。

关键设计:论文的关键设计包括:1) 使用余弦相似度作为语义对齐的度量,因为它简单有效且易于解释。2) 使用混合效应模型来控制个体差异和时间依赖性,从而更准确地评估语义对齐与辅导进展之间的关系。3) 针对导师和学生分别分析语义对齐模式,以揭示角色特定的支架策略。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,角色特定的语义对齐能够显著预测辅导进展,超越了消息顺序和长度等基线特征。具体而言,导师的贡献在互动早期表现出更强的对问题内容的依赖,而学生解决方案对齐与进展略有正相关。这些发现验证了该方法的有效性,并为理解支架动态提供了新的视角。

🎯 应用场景

该研究成果可应用于以下领域:1) 评估和改进现有的对话式辅导系统,使其能够提供更有效的自适应支架。2) 为人工辅导员提供反馈和指导,帮助他们更好地理解学生的学习需求并调整教学策略。3) 开发更智能的教育工具,能够自动分析学生的学习过程并提供个性化的支持。未来的研究可以探索将该方法应用于其他类型的教学对话,并结合多模态信息(如语音和表情)来更全面地理解支架动态。

📄 摘要(原文)

Adaptive scaffolding enhances learning, yet the field lacks robust methods for measuring it within authentic tutoring dialogue. This gap has become more pressing with the rise of remote human tutoring and large language model-based systems. We introduce an embedding-based approach that analyzes scaffolding dynamics by aligning the semantics of dialogue turns, problem statements, and correct solutions. Specifically, we operationalize alignment by computing cosine similarity between tutor and student contributions and task-relevant content. We apply this framework to 1,576 real-world mathematics tutoring dialogues from the Eedi Question Anchored Tutoring Dialogues dataset. The analysis reveals systematic differences in task alignment and distinct temporal patterns in how participants ground their contributions in problem and solution content. Further, mixed-effects models show that role-specific semantic alignment predicts tutorial progression beyond baseline features such as message order and length. Tutor contributions exhibited stronger grounding in problem content early in interactions. In contrast, student solution alignment was modestly positively associated with progression. These findings support scaffolding as a continuous, role-sensitive process grounded in task semantics. By capturing role-specific alignment over time, this approach provides a principled method for analyzing instructional dialogue and evaluating conversational tutoring systems.