Debiased Contrastive Representation Learning for Mitigating Dual Biases in Recommender Systems
作者: Zhirong Huang, Shichao Zhang, Debo Cheng, Jiuyong Li, Lin Liu, Guixian Zhang
分类: cs.IR, cs.AI
发布日期: 2024-08-19
💡 一句话要点
提出DCLMDB框架,通过解偏对比学习缓解推荐系统中流行度和一致性双重偏差
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 推荐系统 偏差缓解 对比学习 流行度偏差 一致性偏差 因果图 解偏推荐
📋 核心要点
- 推荐系统受流行度和一致性偏差影响,导致热门项目过度曝光,用户行为数据分布不均。
- DCLMDB框架利用对比学习,在训练过程中解耦流行度和一致性偏差,提升推荐的公平性。
- 实验表明,DCLMDB在真实数据集上能有效降低双重偏差,并提升推荐的准确性和多样性。
📝 摘要(中文)
在推荐系统中,流行度和一致性偏差会过度偏袒热门项目,导致它们在推荐列表中过度呈现,并造成用户-项目历史数据的不平衡分布,从而损害推荐效果。本文构建了一个因果图来解决这两种偏差,并描述了抽象的数据生成机制。然后,以此为指导,开发了一种新颖的解偏对比学习框架DCLMDB,用于缓解双重偏差。在DCLMDB中,通过对比学习在模型训练过程中处理流行度偏差和一致性偏差,以确保用户的选择和推荐的项目不会受到一致性和流行度的不当影响。在Movielens-10M和Netflix两个真实世界数据集上的大量实验表明,DCLMDB可以有效地减少双重偏差,并显著提高推荐的准确性和多样性。
🔬 方法详解
问题定义:推荐系统中的流行度偏差导致热门物品被过度推荐,而一致性偏差则使用户倾向于选择与他人相似的物品,这两种偏差共同作用,使得推荐结果缺乏个性化和多样性。现有方法通常只关注单一偏差,忽略了双重偏差的相互影响,导致解偏效果不佳。
核心思路:本文的核心思路是通过对比学习,将用户偏好从流行度和一致性偏差中解耦出来。具体来说,模型学习用户在没有偏差影响下的真实偏好表示,并利用对比损失来区分用户真实偏好和受偏差影响的偏好。通过这种方式,模型可以更好地捕捉用户的个性化需求,从而提供更准确和多样的推荐。
技术框架:DCLMDB框架主要包含以下几个模块:1) 用户和物品嵌入模块:将用户和物品映射到低维向量空间。2) 偏差估计模块:估计流行度和一致性偏差对用户行为的影响。3) 对比学习模块:通过对比损失,学习用户在没有偏差影响下的真实偏好表示。4) 推荐模块:基于学习到的用户偏好表示,生成推荐列表。整体流程是,首先利用用户-物品交互数据训练嵌入模块,然后估计偏差,最后通过对比学习解耦偏差并进行推荐。
关键创新:DCLMDB的关键创新在于同时考虑了流行度和一致性偏差,并利用对比学习来解耦这两种偏差对用户偏好的影响。与现有方法相比,DCLMDB能够更全面地解决推荐系统中的偏差问题,从而提供更准确和多样的推荐。此外,本文还构建了一个因果图来描述数据生成机制,为偏差建模提供了理论基础。
关键设计:DCLMDB的关键设计包括:1) 偏差估计方法:采用加权采样的方式估计流行度和一致性偏差。2) 对比损失函数:设计了一种新的对比损失函数,用于区分用户真实偏好和受偏差影响的偏好。3) 网络结构:采用多层感知机(MLP)作为用户和物品嵌入模块,并使用负采样技术加速训练。
🖼️ 关键图片
📊 实验亮点
在Movielens-10M和Netflix两个真实数据集上的实验结果表明,DCLMDB显著优于现有的基线方法。例如,在Movielens-10M数据集上,DCLMDB在Recall@20指标上提升了5%以上,在NDCG@20指标上提升了3%以上。同时,DCLMDB还显著提高了推荐的多样性,表明其能够有效缓解双重偏差。
🎯 应用场景
该研究成果可应用于各种推荐系统,例如电商、视频、音乐和新闻推荐等。通过缓解流行度和一致性偏差,可以提高推荐的公平性、准确性和多样性,从而提升用户满意度和平台收益。此外,该研究的因果建模方法也为其他推荐系统偏差问题提供了借鉴。
📄 摘要(原文)
In recommender systems, popularity and conformity biases undermine recommender effectiveness by disproportionately favouring popular items, leading to their over-representation in recommendation lists and causing an unbalanced distribution of user-item historical data. We construct a causal graph to address both biases and describe the abstract data generation mechanism. Then, we use it as a guide to develop a novel Debiased Contrastive Learning framework for Mitigating Dual Biases, called DCLMDB. In DCLMDB, both popularity bias and conformity bias are handled in the model training process by contrastive learning to ensure that user choices and recommended items are not unduly influenced by conformity and popularity. Extensive experiments on two real-world datasets, Movielens-10M and Netflix, show that DCLMDB can effectively reduce the dual biases, as well as significantly enhance the accuracy and diversity of recommendations.