On Reasoning Behind Next Occupation Recommendation

📄 arXiv: 2604.21204v1 📥 PDF

作者: Shan Dong, Palakorn Achananuparp, Hieu Hien Mai, Lei Wang, Yao Lu, Ee-Peng Lim

分类: cs.CL, cs.AI, cs.IR

发布日期: 2026-04-23

备注: Accepted to PAKDD 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于推理的职业推荐方法,提升LLM在未来职业预测中的性能。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 职业推荐 大型语言模型 推理 原因生成 职业预测

📋 核心要点

  1. 现有职业推荐方法难以捕捉用户决策背后的深层原因,导致推荐结果不够精准。
  2. 论文提出利用LLM生成用户职业选择的原因,并将该原因融入到职业预测过程中,提升推荐效果。
  3. 实验表明,该方法显著提升了LLM在职业预测中的准确性,甚至可与全监督方法媲美。

📝 摘要(中文)

本文提出了一种新颖的推理方法,旨在提升大型语言模型(LLMs)在未来职业预测中的性能。该方法首先利用用户的教育和职业历史,通过一个原因生成器推导出用户的“原因”。该原因总结了用户的偏好,并作为职业预测器的输入,用于推荐用户的下一个职业。然而,这种两步职业预测方法并非易事,因为LLMs与职业道路或每个职业决策背后的未观察到的原因并不一致。因此,我们提出对LLMs进行微调,以提高其推理和职业预测性能。我们首先使用LLM-as-a-Judge推导出高质量的oracle原因,这些原因通过事实性、连贯性和效用标准进行衡量。然后,这些oracle原因被用于微调小型LLMs,以执行原因生成和下一个职业预测。大量的实验表明:(a)我们的方法有效地提高了LLM在下一个职业预测中的准确性,使其与完全监督的方法相当,并优于无监督的方法;(b)一个经过微调以执行原因生成和职业预测的LLM优于两个分别微调以执行这些任务的LLM;(c)下一个职业预测的准确性取决于生成原因的质量。代码已开源。

🔬 方法详解

问题定义:论文旨在解决未来职业推荐问题,现有方法,特别是基于大型语言模型的方法,难以准确预测用户的下一个职业,因为它们缺乏对用户职业选择背后原因的理解。现有方法没有充分利用用户的教育和职业历史来推断其潜在的职业偏好和动机。

核心思路:论文的核心思路是引入一个“原因生成器”,利用用户的历史数据生成用户选择特定职业的原因。这个原因可以被视为用户偏好的总结,然后将其作为职业预测器的输入,从而提高预测的准确性。这种方法模拟了人类在职业选择时进行推理的过程。

技术框架:整体框架包含两个主要阶段:1) 原因生成阶段:利用LLM作为原因生成器,根据用户的教育和职业历史生成“原因”。为了保证原因的质量,使用LLM-as-a-Judge来评估生成原因的事实性、连贯性和效用,并生成高质量的oracle原因。2) 职业预测阶段:将生成的原因作为输入,输入到另一个LLM中,预测用户的下一个职业。这两个阶段可以由同一个LLM完成,也可以由两个独立的LLM完成。

关键创新:论文的关键创新在于将“原因”的概念引入到职业推荐中,并利用LLM自动生成这些原因。这使得模型能够更好地理解用户的偏好和动机,从而做出更准确的预测。此外,论文还提出了一种利用LLM-as-a-Judge来评估和改进生成原因质量的方法。

关键设计:论文的关键设计包括:1) 使用LLM-as-a-Judge来评估生成原因的质量,并生成高质量的oracle原因,用于微调LLM。评估标准包括事实性、连贯性和效用。2) 对LLM进行微调,使其能够同时执行原因生成和职业预测任务。实验表明,一个同时执行这两个任务的LLM比两个分别执行这两个任务的LLM表现更好。3) 实验中使用了多个LLM模型,并比较了它们在原因生成和职业预测方面的性能。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果表明,该方法显著提升了LLM在未来职业预测中的准确性,使其性能与全监督方法相当,并优于无监督方法。一个经过微调以同时执行原因生成和职业预测的LLM,优于两个分别执行这些任务的LLM。实验还验证了下一个职业预测的准确性与生成原因的质量密切相关。

🎯 应用场景

该研究成果可应用于智能招聘平台、职业生涯规划咨询系统等领域,帮助用户更准确地预测和规划未来的职业发展方向。通过理解用户职业选择背后的原因,可以提供更个性化、更有效的职业推荐服务,提升用户满意度和职业发展成功率。

📄 摘要(原文)

In this work, we develop a novel reasoning approach to enhance the performance of large language models (LLMs) in future occupation prediction. In this approach, a reason generator first derives a ``reason'' for a user using his/her past education and career history. The reason summarizes the user's preference and is used as the input of an occupation predictor to recommend the user's next occupation. This two-step occupation prediction approach is, however, non-trivial as LLMs are not aligned with career paths or the unobserved reasons behind each occupation decision. We therefore propose to fine-tune LLMs improving their reasoning and occupation prediction performance. We first derive high-quality oracle reasons, as measured by factuality, coherence and utility criteria, using a LLM-as-a-Judge. These oracle reasons are then used to fine-tune small LLMs to perform reason generation and next occupation prediction. Our extensive experiments show that: (a) our approach effectively enhances LLM's accuracy in next occupation prediction making them comparable to fully supervised methods and outperforming unsupervised methods; (b) a single LLM fine-tuned to perform reason generation and occupation prediction outperforms two LLMs fine-tuned to perform the tasks separately; and (c) the next occupation prediction accuracy depends on the quality of generated reasons. Our code is available at https://github.com/Sarasarahhhhh/job_prediction.