U-Fair: Uncertainty-based Multimodal Multitask Learning for Fairer Depression Detection

📄 arXiv: 2501.09687v1 📥 PDF

作者: Jiaee Cheong, Aditya Bangar, Sinan Kalkan, Hatice Gunes

分类: cs.LG

发布日期: 2025-01-16

备注: To appear at the Proceedings of Machine Learning Research 259, 1-14, 2024 as part of the Machine Learning for Health (ML4H) Symposium 2024

期刊: Proceedings of Machine Learning Research 2024


💡 一句话要点

提出基于不确定性的多模态多任务学习框架U-Fair,用于更公平的抑郁症检测。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多任务学习 抑郁症检测 公平性 不确定性 多模态融合 心理健康 机器学习偏见

📋 核心要点

  1. 现有抑郁症检测方法存在机器学习偏见,且多任务学习在公平性方面的研究不足。
  2. 提出U-Fair框架,利用PHQ-8问卷结构中的不确定性,进行基于性别的任务重加权。
  3. 实验表明,U-Fair能提升抑郁症检测的性能和公平性,并缓解负迁移问题。

📝 摘要(中文)

心理健康领域的机器学习偏见日益成为一个重要挑战。尽管多任务方法通常优于单任务方法,但很少有研究调查多任务学习对抑郁症检测的性能和公平性的影响,也没有利用它来实现更公平的预测结果。本文系统地研究了使用多任务方法来提高抑郁症检测的性能和公平性。我们提出了一种新颖的基于性别的任务重加权方法,该方法利用了PHQ-8问卷的结构中的不确定性。结果表明,与单任务方法相比,多任务方法提高了性能和公平性,但结果并不总是一致的,并且我们看到了负迁移和帕累托前沿减少的证据,这在高风险医疗环境中令人担忧。我们提出的基于性别的、利用不确定性的重加权方法提高了性能和公平性,并在一定程度上缓解了这两个挑战。我们关于每个PHQ-8子项任务难度的发现也与对PHQ-8子项区分能力进行的最大规模研究一致,从而提供了第一个将机器学习发现与对PHQ-8进行的大规模经验人口研究联系起来的切实证据。

🔬 方法详解

问题定义:论文旨在解决抑郁症检测中存在的机器学习偏见问题,特别是性别偏见。现有方法,尤其是单任务学习方法,在公平性方面表现不佳。即使是多任务学习方法,也可能出现负迁移现象,导致性能下降和公平性降低。因此,需要一种能够提高性能的同时,兼顾公平性的抑郁症检测方法。

核心思路:论文的核心思路是利用多任务学习框架,并结合PHQ-8问卷结构中的不确定性信息,对不同任务进行基于性别的重加权。这种方法旨在平衡不同性别在抑郁症检测中的表现,从而减少偏见,提高整体公平性。通过关注PHQ-8问卷中不同子项的难度差异,并结合性别信息,可以更有效地调整任务权重,优化模型训练。

技术框架:U-Fair框架是一个多模态多任务学习框架,它接收多模态输入(例如,语音、文本、视频),并将其用于预测抑郁症。该框架包含以下主要模块:1) 多模态特征提取模块,用于从不同模态的数据中提取特征;2) 多任务学习模块,用于同时学习多个与抑郁症相关的任务(例如,PHQ-8问卷的各个子项);3) 基于不确定性的任务重加权模块,用于根据PHQ-8问卷结构中的不确定性信息,对不同任务进行重加权。

关键创新:论文的关键创新点在于提出了基于不确定性的任务重加权方法。该方法利用PHQ-8问卷结构中的不确定性信息,并结合性别信息,对不同任务进行重加权。这种方法能够更有效地平衡不同性别在抑郁症检测中的表现,从而减少偏见,提高整体公平性。与现有方法相比,U-Fair框架能够更好地利用多任务学习的优势,同时避免负迁移现象,从而提高性能和公平性。

关键设计:U-Fair框架的关键设计包括:1) 使用多模态特征融合技术,将不同模态的特征进行有效融合;2) 使用共享表示层,在不同任务之间共享知识;3) 使用基于不确定性的任务重加权策略,根据PHQ-8问卷结构中的不确定性信息,动态调整不同任务的权重。具体而言,任务权重的计算方式可能涉及到对PHQ-8问卷各个子项的难度进行估计,并结合性别信息进行调整。损失函数的设计可能包括多任务学习损失和公平性约束项,以同时优化性能和公平性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,U-Fair框架在抑郁症检测的性能和公平性方面均优于单任务学习方法。与传统多任务学习方法相比,U-Fair框架能够有效缓解负迁移现象,并显著提高模型的公平性指标。此外,论文还验证了PHQ-8子项任务难度与大规模人口研究结果的一致性,为机器学习在心理健康领域的应用提供了更可靠的依据。

🎯 应用场景

该研究成果可应用于心理健康评估、在线心理咨询、智能辅助诊断等领域。通过更公平、准确的抑郁症检测,可以帮助医疗专业人员更好地识别和治疗抑郁症患者,尤其是有助于减少因性别偏见导致的误诊或漏诊。未来,该技术有望集成到移动健康应用或远程医疗平台中,实现便捷、个性化的心理健康服务。

📄 摘要(原文)

Machine learning bias in mental health is becoming an increasingly pertinent challenge. Despite promising efforts indicating that multitask approaches often work better than unitask approaches, there is minimal work investigating the impact of multitask learning on performance and fairness in depression detection nor leveraged it to achieve fairer prediction outcomes. In this work, we undertake a systematic investigation of using a multitask approach to improve performance and fairness for depression detection. We propose a novel gender-based task-reweighting method using uncertainty grounded in how the PHQ-8 questionnaire is structured. Our results indicate that, although a multitask approach improves performance and fairness compared to a unitask approach, the results are not always consistent and we see evidence of negative transfer and a reduction in the Pareto frontier, which is concerning given the high-stake healthcare setting. Our proposed approach of gender-based reweighting with uncertainty improves performance and fairness and alleviates both challenges to a certain extent. Our findings on each PHQ-8 subitem task difficulty are also in agreement with the largest study conducted on the PHQ-8 subitem discrimination capacity, thus providing the very first tangible evidence linking ML findings with large-scale empirical population studies conducted on the PHQ-8.