Domain Adversarial Training for Mitigating Gender Bias in Speech-based Mental Health Detection

📄 arXiv: 2505.03359v1 📥 PDF

作者: June-Woo Kim, Haram Yoon, Wonkyo Oh, Dawoon Jung, Sung-Hoon Yoon, Dae-Jin Kim, Dong-Ho Lee, Sang-Yeol Lee, Chan-Mo Yang

分类: cs.AI

发布日期: 2025-05-06

备注: Accepted to EMBC 2025


💡 一句话要点

提出基于领域对抗训练的语音心理健康检测方法,缓解性别偏见。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 语音心理健康检测 性别偏见 领域对抗训练 预训练语音模型 E-DAIC数据集

📋 核心要点

  1. 语音AI模型在心理健康检测中面临性别偏见,导致预测不公平和不准确。
  2. 采用领域对抗训练,将不同性别视为不同领域,融入预训练语音模型以缓解偏见。
  3. 在E-DAIC数据集上验证,F1-score最高提升13.29%,显著改善检测性能。

📝 摘要(中文)

本文提出了一种基于语音的AI模型,用于检测抑郁症和创伤后应激障碍(PTSD),旨在解决模型中存在的性别偏见问题。该模型将不同性别视为不同的领域,并将性别信息融入到预训练的语音基础模型中,采用领域对抗训练方法。在E-DAIC数据集上的实验结果表明,该方法显著提高了检测性能,F1-score最高提升了13.29个百分点。研究强调了在AI驱动的心理健康评估中解决人口统计学差异的重要性。

🔬 方法详解

问题定义:现有基于语音的心理健康检测模型存在显著的性别偏见,导致对不同性别群体的诊断准确率差异较大。这种偏见源于训练数据中不同性别样本的分布不平衡以及模型对性别特征的敏感性。现有方法未能有效消除这种性别差异带来的影响,从而影响了模型的公平性和可靠性。

核心思路:本文的核心思路是将不同性别视为不同的领域,利用领域对抗训练(Domain Adversarial Training)来学习与性别无关的语音特征表示。通过对抗训练,模型试图区分语音样本的性别,而领域判别器则试图识别样本的性别来源。这种对抗过程促使模型学习到更具泛化性、与性别无关的特征,从而减少性别偏见。

技术框架:整体框架包含三个主要模块:语音特征提取器、心理健康状态分类器和领域判别器。首先,使用预训练的语音基础模型(例如,wav2vec 2.0)提取语音特征。然后,将提取的特征输入到心理健康状态分类器中,预测抑郁症或PTSD的概率。同时,将相同的特征输入到领域判别器中,用于预测语音样本的性别。分类器和判别器进行对抗训练,分类器试图最小化心理健康状态分类损失,同时最大化领域判别器的损失,而判别器则试图最小化领域判别损失。

关键创新:最重要的创新点在于将领域对抗训练应用于语音心理健康检测,显式地考虑并缓解性别偏见。与传统方法相比,该方法不是简单地增加数据或调整模型参数,而是通过对抗训练的方式,迫使模型学习与性别无关的特征表示,从而更有效地消除性别偏见的影响。

关键设计:领域判别器通常是一个简单的多层感知机(MLP),输入是语音特征,输出是性别的概率分布。损失函数包括心理健康状态分类损失(例如,交叉熵损失)和领域判别损失(例如,梯度反转层的对抗损失)。梯度反转层(Gradient Reversal Layer, GRL)用于在训练过程中反转领域判别器的梯度,从而实现对抗训练。具体的参数设置包括学习率、batch size、GRL的超参数等,这些参数需要根据具体数据集进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,提出的领域对抗训练方法在E-DAIC数据集上显著提高了抑郁症和PTSD的检测性能。与基线模型相比,F1-score最高提升了13.29个百分点。这表明该方法能够有效缓解性别偏见,提高模型对不同性别群体的泛化能力。此外,研究还分析了不同性别群体的性能差异,验证了该方法在减少性别差异方面的有效性。

🎯 应用场景

该研究成果可应用于开发更公平、更可靠的语音心理健康评估系统。这些系统可以用于远程心理健康监测、在线心理咨询和大规模心理健康筛查。通过减少性别偏见,可以提高诊断的准确性和公平性,为不同性别群体提供更好的心理健康服务。未来,该方法可以推广到其他存在偏见问题的AI应用领域,例如招聘、信贷评估等。

📄 摘要(原文)

Speech-based AI models are emerging as powerful tools for detecting depression and the presence of Post-traumatic stress disorder (PTSD), offering a non-invasive and cost-effective way to assess mental health. However, these models often struggle with gender bias, which can lead to unfair and inaccurate predictions. In this study, our study addresses this issue by introducing a domain adversarial training approach that explicitly considers gender differences in speech-based depression and PTSD detection. Specifically, we treat different genders as distinct domains and integrate this information into a pretrained speech foundation model. We then validate its effectiveness on the E-DAIC dataset to assess its impact on performance. Experimental results show that our method notably improves detection performance, increasing the F1-score by up to 13.29 percentage points compared to the baseline. This highlights the importance of addressing demographic disparities in AI-driven mental health assessment.