Enhancing Text-Based Hierarchical Multilabel Classification for Mobile Applications via Contrastive Learning

📄 arXiv: 2507.04413v1 📥 PDF

作者: Jiawei Guo, Yang Xiao, Weipeng Huang, Guangyuan Piao

分类: cs.LG

发布日期: 2025-07-06


💡 一句话要点

提出HMCN和HMCL,增强移动应用文本分层多标签分类性能

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 分层多标签分类 对比学习 移动应用 文本分类 用户建模 自然语言处理 深度学习

📋 核心要点

  1. 现有App分类方法粒度粗,难以满足精细化用户建模需求,而直接利用文本信息进行分层多标签分类具有挑战。
  2. 提出HMCN网络,结合无层级约束的多标签分类和层级约束的顺序预测,更全面地利用文本信息和层级结构。
  3. 引入HMCL对比学习,通过学习更具区分性的App表示,显著提升HMCN的分类性能,并在实际应用中验证了有效性。

📝 摘要(中文)

本文针对移动应用(App)的分层多标签分类问题,提出了一种新的方法。移动应用的分层标签系统能够为下游业务提供更细粒度的标签,从而改进用户建模。本文利用App的名称和描述等文本信息进行分层多标签分类,提出了HMCN(分层多标签分类网络),从两个角度处理分类问题:一是无层级约束的多标签分类,二是在每个层级顺序预测标签,考虑层级约束。此外,还提出了HMCL(分层多标签对比学习),学习更具区分性的App表示,以增强HMCN的性能。在腾讯应用商店数据集和两个公共数据集上的实验结果表明,该方法优于现有方法。该方法已在腾讯部署一年多,其App多标签分类输出帮助下游任务——用户信用风险管理——在Kolmogorov-Smirnov指标上提高了10.70%。

🔬 方法详解

问题定义:论文旨在解决移动应用的分层多标签分类问题。现有的App分类方法通常采用宽泛的类别,无法满足精细化用户建模的需求。直接利用App的文本信息(如名称和描述)进行分层多标签分类面临挑战,需要同时考虑文本语义信息和层级结构约束。

核心思路:论文的核心思路是结合多标签分类和层级分类的优势,并利用对比学习增强App表示的区分性。通过HMCN网络同时进行无层级约束的多标签分类和考虑层级约束的顺序预测,从而更全面地利用文本信息和层级结构。利用HMCL对比学习,使模型学习到更具区分性的App表示,从而提升分类性能。

技术框架:整体框架包含两个主要模块:HMCN和HMCL。HMCN首先利用文本编码器(如BERT)提取App的文本特征。然后,HMCN包含两个分支:一个分支进行无层级约束的多标签分类,预测App的所有标签;另一个分支按照层级结构,逐层预测App的标签,并考虑父节点的标签信息。HMCL则利用对比学习,通过构造正负样本对,训练文本编码器,使其能够生成更具区分性的App表示。

关键创新:论文的关键创新在于结合了多标签分类和层级分类,并引入了对比学习。传统的层级分类方法通常只考虑层级结构,忽略了标签之间的关联性。而多标签分类则忽略了层级结构。HMCN同时考虑了这两种信息,从而提高了分类性能。HMCL则通过对比学习,增强了App表示的区分性,进一步提升了分类性能。

关键设计:HMCN使用了BERT作为文本编码器。在多标签分类分支,使用了sigmoid激活函数和二元交叉熵损失函数。在层级分类分支,使用了softmax激活函数和交叉熵损失函数。HMCL使用了InfoNCE损失函数,通过构造正负样本对,训练文本编码器。正样本通常是同一个App的不同文本描述,负样本则是不同的App。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,提出的HMCN和HMCL方法在腾讯应用商店数据集和两个公共数据集上均取得了优于现有方法的性能。在腾讯应用商店数据集上,该方法帮助下游任务——用户信用风险管理——在Kolmogorov-Smirnov指标上提高了10.70%。这表明该方法具有很强的实际应用价值。

🎯 应用场景

该研究成果可广泛应用于移动应用商店、广告推荐、用户画像等领域。通过对App进行更精细化的分层多标签分类,可以提升用户建模的准确性,从而改进推荐系统的效果,提高广告投放的精准度,并为信用风险管理等下游任务提供更好的支持。该方法已在腾讯应用商店成功部署,并为用户信用风险管理带来了显著的性能提升,具有重要的实际应用价值。

📄 摘要(原文)

A hierarchical labeling system for mobile applications (apps) benefits a wide range of downstream businesses that integrate the labeling with their proprietary user data, to improve user modeling. Such a label hierarchy can define more granular labels that capture detailed app features beyond the limitations of traditional broad app categories. In this paper, we address the problem of hierarchical multilabel classification for apps by using their textual information such as names and descriptions. We present: 1) HMCN (Hierarchical Multilabel Classification Network) for handling the classification from two perspectives: the first focuses on a multilabel classification without hierarchical constraints, while the second predicts labels sequentially at each hierarchical level considering such constraints; 2) HMCL (Hierarchical Multilabel Contrastive Learning), a scheme that is capable of learning more distinguishable app representations to enhance the performance of HMCN. Empirical results on our Tencent App Store dataset and two public datasets demonstrate that our approach performs well compared with state-of-the-art methods. The approach has been deployed at Tencent and the multilabel classification outputs for apps have helped a downstream task--credit risk management of user--improve its performance by 10.70% with regard to the Kolmogorov-Smirnov metric, for over one year.