Enhancing Online Recruitment with Category-Aware MoE and LLM-based Data Augmentation

📄 arXiv: 2604.21264v1 📥 PDF

作者: Minping Chen, Bing Xu, Zulong Chen, Chuanfei Xu, Ying Zhou, Zui Tao, Zeyi Wen

分类: cs.AI

发布日期: 2026-04-23

备注: Accepted to ACL Industry Track 2026


💡 一句话要点

提出基于LLM数据增强和类别感知MoE的在线招聘方法,提升人岗匹配效果。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 在线招聘 人岗匹配 大型语言模型 数据增强 混合专家模型 类别感知 思维链 推荐系统

📋 核心要点

  1. 现有在线招聘方法难以有效处理低质量职位描述和相似候选人-职位匹配,导致模型性能下降。
  2. 利用LLM进行数据增强,优化职位描述,并设计类别感知的MoE模型,区分相似候选人-职位对。
  3. 实验结果表明,该方法在AUC和GAUC指标上均优于现有方法,并显著提升了在线点击转化率。

📝 摘要(中文)

本文提出了一种基于大型语言模型(LLM)的在线招聘增强方法,用于解决人岗匹配(PJF)问题。现有方法在处理低质量职位描述和相似候选人-职位对时面临挑战,影响模型性能。为了解决这些问题,本文提出了两种新技术:(1) 基于LLM的数据增强,利用思维链(COT)提示来润色和重写低质量的职位描述;(2) 类别感知的混合专家模型(MoE),用于辅助识别相似的候选人-职位对。该MoE模块结合了类别嵌入,以动态地为专家分配权重,并为相似的候选人-职位对学习更可区分的模式。离线评估和在线A/B测试表明,该方法在AUC上相对超过现有方法2.40%,在GAUC上相对超过7.46%,并在在线测试中将点击转化率(CTCVR)提高了19.4%,节省了数百万人民币的外部猎头费用。

🔬 方法详解

问题定义:论文旨在解决在线招聘中人岗匹配(PJF)问题。现有方法在处理低质量的职位描述(例如信息不完整、表达模糊)以及区分高度相似的候选人-职位对时表现不佳。这些问题导致模型无法准确判断候选人与职位的匹配程度,影响招聘效率和质量。

核心思路:论文的核心思路是利用大型语言模型(LLM)增强职位描述的质量,并设计一个类别感知的混合专家模型(MoE)来更好地处理相似的候选人-职位对。通过LLM的数据增强,可以提升职位描述的清晰度和信息量。而类别感知的MoE模型则能够根据职位类别动态调整专家权重,从而学习到更具区分性的特征表示。

技术框架:整体框架包含两个主要模块:(1) LLM-based Data Augmentation模块,使用Chain-of-Thought (COT) prompting来润色和重写低质量的职位描述;(2) Category-aware Mixture of Experts (MoE)模块,该模块利用类别嵌入来动态地为不同的专家分配权重,每个专家负责学习特定类别的候选人-职位匹配模式。最终,MoE的输出被用于预测候选人与职位的匹配度。

关键创新:论文的关键创新在于结合了LLM和MoE来解决在线招聘中的人岗匹配问题。具体来说,LLM用于提升职位描述的质量,而类别感知的MoE则用于更好地处理相似的候选人-职位对。这种结合使得模型能够更准确地理解职位需求和候选人能力,从而提高匹配的准确性。

关键设计:在LLM数据增强方面,使用了Chain-of-Thought prompting,通过逐步推理的方式生成更清晰、更详细的职位描述。在MoE模块中,类别嵌入被用于动态调整专家权重,使得模型能够根据职位类别自适应地学习不同的匹配模式。具体的损失函数和网络结构细节未在摘要中详细说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在离线评估中,AUC指标相对提升2.40%,GAUC指标相对提升7.46%。在线A/B测试显示,点击转化率(CTCVR)提升了19.4%。此外,该方法还节省了数百万人民币的外部猎头费用,证明了其在实际应用中的价值。

🎯 应用场景

该研究成果可广泛应用于各类在线招聘平台,提升人岗匹配的准确性和效率。通过优化职位描述和提高相似候选人-职位对的区分度,可以减少招聘成本,提高招聘质量,并改善用户体验。该方法还可扩展到其他推荐系统领域,例如商品推荐、内容推荐等。

📄 摘要(原文)

Person-Job Fit (PJF) is a critical component for online recruitment. Existing approaches face several challenges, particularly in handling low-quality job descriptions and similar candidate-job pairs, which impair model performance. To address these challenges, this paper proposes a large language model (LLM) based method with two novel techniques: (1) LLM-based data augmentation, which polishes and rewrites low-quality job descriptions by leveraging chain-of-thought (COT) prompts, and (2) category-aware Mixture of Experts (MoE) that assists in identifying similar candidate-job pairs. This MoE module incorporates category embeddings to dynamically assign weights to the experts and learns more distinguishable patterns for similar candidate-job pairs. We perform offline evaluations and online A/B tests on our recruitment platform. Our method relatively surpasses existing methods by 2.40% in AUC and 7.46% in GAUC, and boosts click-through conversion rate (CTCVR) by 19.4% in online tests, saving millions of CNY in external headhunting expenses.