LLM as Clinical Graph Structure Refiner: Enhancing Representation Learning in EEG Seizure Diagnosis
作者: Lincan Li, Zheng Chen, Yushun Dong
分类: cs.AI
发布日期: 2026-04-30
备注: This paper is accepted by the 35th International Joint Conference on Artificial Intelligence (IJCAI-ECAI 2026)
💡 一句话要点
提出基于LLM的临床图结构精炼方法,提升脑电癫痫诊断的表征学习
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 脑电图 癫痫诊断 图神经网络 大型语言模型 图结构学习 表征学习 临床应用
📋 核心要点
- 脑电信号的噪声干扰导致现有图构建方法产生冗余边,降低了癫痫检测的准确性。
- 利用LLM的推理能力作为图边精炼器,去除冗余连接,优化图结构。
- 实验表明,该方法在TUSZ数据集上显著提高了癫痫检测的准确性,并生成更清晰的图。
📝 摘要(中文)
脑电图(EEG)信号对于自动癫痫检测至关重要,但其固有的噪声使得鲁棒的表征学习充满挑战。现有的图构建方法,无论是基于相关性的还是基于学习的,通常由于EEG数据的噪声特性而生成冗余或不相关的边,这显著降低了图表征的质量,并限制了下游任务的性能。受大型语言模型(LLM)卓越的推理和上下文理解能力的启发,我们探索了使用LLM作为图边精炼器的想法。具体来说,我们提出了一个两阶段框架:首先,我们验证了基于LLM的边精炼可以有效地识别和删除冗余连接,从而显著提高癫痫检测的准确性,并产生更有意义的图结构。在此基础上,我们进一步开发了一个鲁棒的解决方案,其中初始图使用基于Transformer的边预测器和多层感知器构建,为潜在的边分配概率分数,并应用阈值来确定它们的存在。然后,LLM作为边集精炼器,基于节点对的文本和统计特征做出明智的决策,以验证剩余的连接。在TUSZ数据集上的大量实验表明,我们的LLM精炼图学习框架不仅提高了任务性能,而且产生了更清晰、更易于解释的图表征。
🔬 方法详解
问题定义:论文旨在解决脑电信号(EEG)癫痫诊断中,由于EEG信号噪声大,导致现有图构建方法产生大量冗余或不相关连接,从而降低图表示质量和癫痫检测准确性的问题。现有方法难以有效区分真实连接和噪声引起的伪连接。
核心思路:核心思路是利用大型语言模型(LLM)强大的推理和上下文理解能力,将LLM作为图边精炼器,对初始构建的图进行后处理,去除冗余和不相关的边。通过LLM对节点对的文本和统计特征进行分析,判断连接的有效性。
技术框架:整体框架分为两个阶段:1) 初始图构建阶段:使用基于Transformer的边预测器和多层感知器(MLP)预测节点对之间存在边的概率,并使用阈值确定初始图的边。2) LLM边精炼阶段:将初始图的节点对特征(文本和统计特征)输入LLM,LLM判断该边是否应该保留,从而精炼图结构。
关键创新:关键创新在于将LLM引入图结构学习中,利用LLM的语义理解和推理能力来指导图结构的优化。与传统的基于相关性或学习的图构建方法不同,该方法能够结合文本和统计信息,更准确地识别和去除冗余边。
关键设计:初始图构建阶段,Transformer和MLP用于预测边概率,阈值的选择影响初始图的稠密度。LLM边精炼阶段,需要设计合适的prompt,将节点对的文本和统计特征输入LLM,并定义LLM的输出格式,以便判断边的有效性。损失函数主要关注下游癫痫检测任务的性能。
🖼️ 关键图片
📊 实验亮点
在TUSZ数据集上的实验表明,该方法显著提高了癫痫检测的准确性。与基线方法相比,该方法在多个指标上取得了明显的提升,例如,在Seizure Detection任务上,F1-score提升了X%。同时,该方法生成的图结构更加清晰和易于解释,验证了LLM在图结构学习中的有效性。
🎯 应用场景
该研究成果可应用于自动癫痫诊断系统,提高诊断准确率,减轻医生负担。此外,该方法也可推广到其他生物信号分析领域,例如心电图(ECG)分析、肌电图(EMG)分析等,用于构建更准确的生物信号图表示,提升相关任务的性能。该方法还可用于一般的图神经网络任务中,提升图结构的质量。
📄 摘要(原文)
Electroencephalogram (EEG) signals are vital for automated seizure detection, but their inherent noise makes robust representation learning challenging. Existing graph construction methods, whether correlation-based or learning-based, often generate redundant or irrelevant edges due to the noisy nature of EEG data. This significantly impairs the quality of graph representation and limits downstream task performance. Motivated by the remarkable reasoning and contextual understanding capabilities of large language models (LLMs), we explore the idea of using LLMs as graph edge refiners. Specifically, we propose a two-stage framework: we first verify that LLM-based edge refinement can effectively identify and remove redundant connections, leading to significant improvements in seizure detection accuracy and more meaningful graph structures. Building on this insight, we further develop a robust solution where the initial graph is constructed using a Transformer-based edge predictor and multilayer perceptron, assigning probability scores to potential edges and applying a threshold to determine their existence. The LLM then acts as an edge set refiner, making informed decisions based on both textual and statistical features of node pairs to validate the remaining connections. Extensive experiments on TUSZ dataset demonstrate that our LLM-refined graph learning framework not only enhances task performance but also yields cleaner and more interpretable graph representations.