Towards LLM-Empowered Knowledge Tracing via LLM-Student Hierarchical Behavior Alignment in Hyperbolic Space
作者: Xingcheng Fu, Shengpeng Wang, Yisen Gao, Xianxian Li, Chunpei Li, Qingyun Sun, Dongran Yu
分类: cs.AI
发布日期: 2026-02-26
备注: 9 pages, 6 figures, Accepted to AAAI 2026
💡 一句话要点
提出L-HAKT,利用LLM和双曲空间对齐学生行为,提升知识追踪效果
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 知识追踪 大语言模型 双曲空间 对比学习 学生行为建模
📋 核心要点
- 现有知识追踪方法难以捕捉认知状态的层级演化和个体化问题难度感知,限制了追踪精度。
- L-HAKT利用大语言模型构建知识点层级依赖,并通过学生代理生成数据进行对比学习,对齐真实数据。
- 实验表明,L-HAKT在多个真实数据集上表现出色,验证了其在知识追踪任务中的有效性。
📝 摘要(中文)
知识追踪(KT)旨在通过持续监测学生的学习状态来诊断其概念掌握程度。现有方法主要侧重于基于ID或文本信息的行为序列研究,但往往无法捕捉(1)认知状态的层级演化和(2)由于语义建模的局限性而导致的个体化问题难度感知。因此,本文提出了一种基于大语言模型和双曲空间对齐的知识追踪方法(L-HAKT)。首先,教师代理深入解析问题语义,并显式构建知识点的层级依赖关系;学生代理模拟学习行为以生成合成数据。然后,在双曲空间中对合成数据和真实数据进行对比学习,以减少问题难度和遗忘模式等关键特征的分布差异。最后,通过优化双曲曲率,显式地对知识点的树状层级结构进行建模,精确地表征不同层级知识点的学习曲线形态差异。在四个真实教育数据集上的大量实验验证了L-HAKT框架的有效性。
🔬 方法详解
问题定义:现有知识追踪方法主要依赖于ID或浅层文本特征,无法充分理解知识点之间的层级关系,也难以捕捉学生对问题难度的个体化感知。这导致知识追踪的准确性受到限制,无法为学生提供个性化的学习建议。
核心思路:L-HAKT的核心思路是利用大语言模型(LLM)的强大语义理解能力,显式地构建知识点的层级依赖关系,并使用学生代理模拟学习行为生成合成数据。通过在双曲空间中进行对比学习,对齐合成数据和真实数据,从而提升模型对学生认知状态的理解和预测能力。
技术框架:L-HAKT框架包含三个主要模块:1) 教师代理:利用LLM解析问题语义,构建知识点的层级依赖关系。2) 学生代理:模拟学生的学习行为,生成合成数据。3) 双曲空间对齐:在双曲空间中进行对比学习,对齐合成数据和真实数据,并优化双曲曲率以建模知识点的层级结构。
关键创新:L-HAKT的关键创新在于:1) 利用LLM显式构建知识点的层级依赖关系,克服了传统方法对知识点关系理解不足的问题。2) 采用双曲空间建模知识点的层级结构,更适合表示树状结构数据。3) 通过对比学习对齐合成数据和真实数据,减少了数据分布差异带来的影响。
关键设计:L-HAKT的关键设计包括:1) 使用LLM进行知识点层级关系抽取的具体prompt设计。2) 学生代理模拟学习行为的策略,例如遗忘曲线的建模。3) 双曲空间对比学习的损失函数设计,以及双曲曲率的优化方法。具体参数设置和网络结构细节在论文中进行了详细描述,此处未知。
🖼️ 关键图片
📊 实验亮点
L-HAKT在四个真实世界的教育数据集上进行了广泛的实验,结果表明L-HAKT显著优于现有的知识追踪方法。具体的性能提升幅度和对比基线需要在论文中查找,此处未知。实验结果验证了L-HAKT在知识追踪任务中的有效性和优越性。
🎯 应用场景
L-HAKT可应用于在线教育平台、智能辅导系统等领域,通过更准确地追踪学生的知识掌握情况,提供个性化的学习路径和练习推荐,从而提高学习效率和效果。该研究还有助于开发更智能的教育机器人和虚拟教师,为学生提供更优质的教育资源。
📄 摘要(原文)
Knowledge Tracing (KT) diagnoses students' concept mastery through continuous learning state monitoring in education.Existing methods primarily focus on studying behavioral sequences based on ID or textual information.While existing methods rely on ID-based sequences or shallow textual features, they often fail to capture (1) the hierarchical evolution of cognitive states and (2) individualized problem difficulty perception due to limited semantic modeling. Therefore, this paper proposes a Large Language Model Hyperbolic Aligned Knowledge Tracing(L-HAKT). First, the teacher agent deeply parses question semantics and explicitly constructs hierarchical dependencies of knowledge points; the student agent simulates learning behaviors to generate synthetic data. Then, contrastive learning is performed between synthetic and real data in hyperbolic space to reduce distribution differences in key features such as question difficulty and forgetting patterns. Finally, by optimizing hyperbolic curvature, we explicitly model the tree-like hierarchical structure of knowledge points, precisely characterizing differences in learning curve morphology for knowledge points at different levels. Extensive experiments on four real-world educational datasets validate the effectiveness of our Large Language Model Hyperbolic Aligned Knowledge Tracing (L-HAKT) framework.