Job Skill Extraction via LLM-Centric Multi-Module Framework
作者: Guojing Li, Zichuan Fu, Junyi Li, Faxue Liu, Wenxia Zhou, Yejing Wang, Jingtong Gao, Maolin Wang, Rungen Liu, Wenlin Zhang, Xiangyu Zhao
分类: cs.CL
发布日期: 2026-04-23
备注: 5 pages, 5 figures, 3 tables
💡 一句话要点
提出SRICL框架,解决LLM在职位技能抽取中边界漂移和幻觉问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 职位技能抽取 大语言模型 语义检索 上下文学习 监督微调 确定性验证 自然语言处理
📋 核心要点
- 现有LLM在职位技能抽取中存在边界漂移、格式错误和幻觉问题,尤其是在长尾术语和跨领域情况下。
- SRICL框架结合语义检索、上下文学习和监督微调,并引入确定性验证器,以提升技能抽取的准确性和可靠性。
- 实验表明,SRICL在多个数据集上显著优于GPT-3.5,有效减少了无效标签和幻觉span的产生。
📝 摘要(中文)
本文提出了一种以LLM为中心的框架SRICL,用于从职位广告中抽取span级别的技能。由于生成式大语言模型(LLM)在处理长尾术语和跨领域迁移时,经常产生格式错误的span、边界漂移和幻觉。SRICL结合了语义检索(SR)、上下文学习(ICL)和监督微调(SFT)以及确定性验证器。SR从ESCO中提取领域内的标注句子和定义,形成格式约束的提示,以稳定边界并处理协调问题。SFT对齐输出行为,而验证器通过最少的重试来强制执行配对、非重叠和BIO合法性。在六个跨部门和语言的职位广告句子span标注语料库上,SRICL在STRICT-F1指标上显著优于GPT-3.5提示基线,并大幅减少了无效标签和幻觉span,从而能够在低资源、多领域环境中实现可靠的句子级部署。
🔬 方法详解
问题定义:论文旨在解决从职位广告文本中准确抽取技能短语的问题。现有方法,特别是直接使用大型语言模型(LLM)进行生成式抽取时,面临着三个主要痛点:一是生成的技能短语格式不正确;二是技能短语的边界不准确,出现漂移现象;三是LLM容易产生幻觉,生成不存在的技能。
核心思路:论文的核心思路是利用语义检索(SR)从领域知识库中检索相关的示例,结合上下文学习(ICL)和监督微调(SFT)来引导LLM生成更准确、更可靠的技能短语。此外,引入确定性验证器来纠正LLM生成结果中的错误,确保输出的技能短语符合预定义的格式和规则。
技术框架:SRICL框架包含以下几个主要模块:1) 语义检索模块:从ESCO等领域知识库中检索与输入职位广告文本相关的句子和技能定义。2) 上下文学习模块:将检索到的示例构建成prompt,输入到LLM中,引导LLM进行技能抽取。3) 监督微调模块:使用标注数据对LLM进行微调,使其更好地适应技能抽取任务。4) 确定性验证器:对LLM的输出进行验证,确保其符合预定义的格式和规则,例如BIO标注的合法性、技能短语之间的非重叠性等。
关键创新:SRICL的关键创新在于将语义检索、上下文学习、监督微调和确定性验证器结合起来,形成一个完整的技能抽取框架。通过语义检索引入领域知识,通过上下文学习和监督微调引导LLM生成更准确的技能短语,并通过确定性验证器纠正LLM的错误,从而显著提高了技能抽取的准确性和可靠性。与现有方法相比,SRICL更注重利用领域知识和规则来约束LLM的生成行为,从而减少了幻觉和错误。
关键设计:在语义检索模块中,使用了基于向量相似度的检索方法,例如使用预训练的词向量或句子向量来表示职位广告文本和领域知识库中的句子,然后计算它们之间的相似度。在上下文学习模块中,设计了特定的prompt模板,用于引导LLM进行技能抽取。在监督微调模块中,使用了交叉熵损失函数来优化LLM的参数。在确定性验证器中,使用了正则表达式和规则引擎来验证LLM的输出是否符合预定义的格式和规则。
🖼️ 关键图片
📊 实验亮点
SRICL在六个公共职位广告数据集上取得了显著的STRICT-F1提升,超越了GPT-3.5的prompting基线。实验结果表明,SRICL能够有效减少无效标签和幻觉span的产生,提高了技能抽取的准确性和可靠性。具体的性能提升幅度在不同数据集上有所不同,但总体上都优于现有方法。
🎯 应用场景
该研究成果可应用于招聘平台、人力资源管理系统等领域,实现候选人与职位需求的精准匹配,提高招聘效率。同时,可用于劳动力市场分析,为政策制定者提供数据支持,促进就业。
📄 摘要(原文)
Span-level skill extraction from job advertisements underpins candidate-job matching and labor-market analytics, yet generative large language models (LLMs) often yield malformed spans, boundary drift, and hallucinations, especially with long-tail terms and cross-domain shift. We present SRICL, an LLM-centric framework that combines semantic retrieval (SR), in-context learning (ICL), and supervised fine-tuning (SFT) with a deterministic verifier. SR pulls in-domain annotated sentences and definitions from ESCO to form format-constrained prompts that stabilize boundaries and handle coordination. SFT aligns output behavior, while the verifier enforces pairing, non-overlap, and BIO legality with minimal retries. On six public span-labeled corpora of job-ad sentences across sectors and languages, SRICL achieves substantial STRICT-F1 improvements over GPT-3.5 prompting baselines and sharply reduces invalid tags and hallucinated spans, enabling dependable sentence-level deployment in low-resource, multi-domain settings.