Beyond Semantics: An Evidential Reasoning-Aware Multi-View Learning Framework for Trustworthy Mental Health Prediction

📄 arXiv: 2605.05121v1 📥 PDF

作者: Yucheng Ruan, Ling Huang, Qika Lin, Kai He, Mengling Feng

分类: cs.CL

发布日期: 2026-05-06


💡 一句话要点

提出一种基于证据推理的多视角学习框架,用于可信赖的精神健康预测。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 精神健康预测 多视角学习 证据推理 不确定性建模 自然语言处理

📋 核心要点

  1. 现有精神健康预测方法依赖语义表示,在噪声数据下易产生过度自信的预测,缺乏可靠的不确定性估计。
  2. 提出多视角学习框架,融合编码器语义信息和解码器推理信息,利用证据推理显式建模不确定性。
  3. 在三个数据集上验证,提升了预测性能,提供了可信的不确定性估计和可解释的推理信号。

📝 摘要(中文)

本文提出了一种用于精神健康预测的多视角学习框架,旨在解决现有方法过度依赖语义信息、在数据存在歧义或噪声时产生过度自信预测的问题。该框架融合了编码器模型的语义信息和解码器模型的高级推理信息,以可信的方式获得推理感知表示和不确定性建模。采用基于主观逻辑的证据学习框架,显式地建模不确定性,并引入证据融合策略,平衡互补视角,同时降低不可靠证据的影响。在Dreaddit、SDCNL和DepSeverity三个数据集上的实验结果表明,该框架分别取得了0.835、0.731和0.751的准确率,验证了其在可靠精神健康预测方面的潜力。噪声鲁棒性和可解释性案例研究进一步证实,该框架不仅提高了预测性能,还提供了可信的不确定性估计和易于理解的推理信号,适用于风险敏感的精神健康评估应用。

🔬 方法详解

问题定义:现有基于文本的精神健康预测方法主要依赖于深度学习和大型语言模型的语义表示,但这些方法在面对真实世界中存在的歧义、噪声或数据分布偏移时,往往会产生过度自信的预测。此外,现有方法通常缺乏可靠的不确定性估计,这降低了在风险敏感的精神健康应用中的信任度。

核心思路:本文的核心思路是将精神健康预测任务视为一个多视角学习问题,通过融合来自不同模型的视角来提高预测的准确性和可靠性。具体来说,利用编码器模型提取语义信息,并利用解码器模型进行更高层次的推理。同时,采用证据推理框架来显式地建模预测的不确定性,从而提供更可信的预测结果。

技术框架:该框架主要包含以下几个模块:1) 语义信息提取模块:使用编码器模型(如BERT)从文本数据中提取语义表示。2) 推理信息提取模块:使用解码器模型(如GPT)从文本数据中提取推理信息。3) 证据学习模块:基于主观逻辑,将来自不同视角的表示转换为证据,并显式地建模不确定性。4) 证据融合模块:采用证据融合策略,平衡互补视角,同时降低不可靠证据的影响。5) 预测模块:基于融合后的证据进行精神健康预测。

关键创新:该论文的关键创新在于:1) 提出了一种多视角学习框架,融合了编码器和解码器模型的优势,从而更全面地理解文本数据。2) 引入了证据推理框架,显式地建模预测的不确定性,从而提供更可信的预测结果。3) 提出了一种证据融合策略,能够平衡互补视角,同时降低不可靠证据的影响。与现有方法相比,该方法不仅提高了预测性能,还提供了更可靠的不确定性估计和更易于理解的推理信号。

关键设计:在证据学习模块中,使用了Subjective Logic来建模证据,并定义了相应的证据融合规则。证据融合策略的设计目标是平衡不同视角的贡献,同时降低不可靠证据的影响。具体的参数设置和网络结构取决于所使用的编码器和解码器模型。损失函数的设计需要考虑预测的准确性和不确定性,例如可以使用交叉熵损失函数来衡量预测的准确性,并使用KL散度来衡量预测的不确定性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在三个真实世界数据集(Dreaddit、SDCNL和DepSeverity)上的实验结果表明,该框架分别取得了0.835、0.731和0.751的准确率,显著优于现有方法。噪声鲁棒性实验表明,该框架在面对噪声数据时仍能保持较高的预测准确性。案例研究表明,该框架能够提供可解释的推理信号,有助于理解模型的预测过程。

🎯 应用场景

该研究成果可应用于自动化精神健康评估、风险预测和个性化干预等领域。通过提供更准确和可信的预测,该框架可以帮助临床医生更好地诊断和治疗精神疾病,并为患者提供更有效的支持。此外,该研究还可以促进对精神健康问题更深入的理解,并为开发更有效的干预措施提供新的思路。

📄 摘要(原文)

Automated mental health prediction using textual data has shown promising results with deep learning and large language models. However, deploying these models in high-stakes real-world settings remains challenging, as existing approaches largely rely on semantic representations and often produce overconfident predictions under ambiguous, noisy, or shifted data. Moreover, most methods lack reliable uncertainty estimation, undermining trust in risk-sensitive mental health applications. To address these limitations, we formulate the task as a multi-view learning problem that integrates semantic information from encoder-only models with higher-level reasoning information from decoder-only models, where reasoning-aware representations and uncertainty modeling are obtained in a trustworthy manner. To ensure reliable fusion, we adopt an evidential learning framework based on Subjective Logic to explicitly model uncertainty and introduce an evidential fusion strategy that balances complementary views while discounting unreliable evidence. Benchmarking on three real-world datasets, Dreaddit, SDCNL, and DepSeverity, reports accuracies of 0.835, 0.731, and 0.751, respectively, demonstrating its potential for reliable mental health prediction. Additional experiments on robustness to noise and case studies for interpretability confirm that our proposed framework not only improves predictive performance but also provides trustworthy uncertainty estimates and human-understandable reasoning signals, making it suitable for risk-sensitive applications in mental health assessment.