Intent-Driven Semantic ID Generation for Grounded Conversational News Recommendation

📄 arXiv: 2605.07613v1 📥 PDF

作者: Hongyang Su, Beibei Kong, Lei Cheng, Chengxiang Zhuo, Zang Li, Chenyun Yu

分类: cs.CL

发布日期: 2026-05-08

备注: Accepted at ACL 2026 Industry Track (Oral)


💡 一句话要点

提出意图驱动的语义ID生成框架,解决对话式新闻推荐中的隐式意图与幻觉问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 对话式推荐 语义ID 检索增强生成 大语言模型 冷启动推荐 思维链蒸馏 幻觉消除

📋 核心要点

  1. 现有RAG流程难以处理缺乏显式关键词的隐式用户意图,导致检索阶段出现严重瓶颈,无法有效匹配新闻。
  2. 提出意图驱动的语义ID(SID)生成框架,通过两阶段训练将意图映射为层级化SID,实现生成式推荐与检索池的精准对齐。
  3. 实验显示该方法在152K新闻库中实现0%幻觉率,在冷启动场景下表现优异,且相比GPT-4+混合RAG方案显著降低了计算成本。

📝 摘要(中文)

对话式新闻推荐要求在快速更新的新闻语料库中进行精准检索,同时需处理缺乏显式关键词的隐式用户意图。本文识别了生产对话中的6种意图类型,其中5种隐式意图对标准RAG流程构成了检索瓶颈。为此,作者提出了“生成后匹配”(Generate-then-Match)范式下的意图驱动语义ID(SID)生成方法。通过多任务SID对齐与GPT-4思维链蒸馏的两阶段训练,大语言模型能将多样化意图映射为层级化SID前缀,并与新闻池进行模糊匹配,从而确保推荐的完全接地(Grounded)。此外,Profile-Aware Dual-Signal Reasoning (PADR) 模块使冷启动用户仅凭个人资料即可获得有效推荐。在主流中文新闻平台上的实验表明,该7B模型在152K SID空间内实现了0%幻觉率,且在性能指标上超越了GPT-4+混合RAG方案,同时计算成本降低了约100倍。

🔬 方法详解

问题定义:对话式新闻推荐面临“意图-内容”鸿沟,即用户意图往往是隐式的(如“找点轻松的”),而传统RAG依赖显式关键词检索,导致在快速更新的新闻库中难以实现精准接地,极易产生幻觉。

核心思路:采用“生成后匹配”范式,将推荐任务转化为语义ID(SID)的生成问题。通过将新闻映射为层级化SID,模型不再直接生成文本,而是生成指向特定新闻的语义标识符,从根本上杜绝了幻觉。

技术框架:整体架构包含两阶段训练:首先进行多任务SID对齐,学习意图与SID的映射关系;其次利用GPT-4进行思维链(CoT)蒸馏,增强模型对复杂意图的推理能力。PADR模块则通过双信号推理,整合用户画像信息,解决冷启动难题。

关键创新:引入层级化语义ID(SID)作为中间桥梁,将生成式大模型的推理能力与检索系统的确定性结合,实现了意图驱动的精准推荐,并有效解决了冷启动用户推荐缺失的问题。

关键设计:采用层级化SID前缀设计以支持模糊匹配;通过多任务学习优化意图对齐;PADR模块通过双信号机制(用户画像+意图信号)进行推理,在保证推荐准确性的同时,将推理成本降低了约两个数量级。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

在152K规模的新闻库中,该7B模型实现了0%的幻觉率,L1匹配准确率达到12.4%,是随机基线的4倍。在冷启动场景下,该模型达到了18.0%的L1匹配率(随机基线为0%),且在细粒度指标上超越了GPT-4+混合RAG方案,同时推理成本降低了约100倍。

🎯 应用场景

该技术适用于各类实时性要求高、用户意图模糊的对话式推荐系统,如智能新闻客户端、个性化内容助手及电商导购机器人。其低成本、高准确度及对冷启动用户的友好支持,使其在资源受限的移动端或大规模生产环境中具有极高的商业应用价值。

📄 摘要(原文)

Conversational news recommendation requires grounding each suggestion in a rapidly evolving article corpus while addressing implicit user intents that lack explicit retrievable keywords. To characterize this scenario, we identify 6 intent types from production dialogues: five are implicit and pose fundamental challenges to standard RAG pipelines, forming a critical retrieve-first bottleneck. To address these issues, we introduce intent-driven Semantic ID (SID) generation under a Generate-then-Match paradigm. With two-stage training that consists of multi-task SID alignment and GPT-4 Chain-of-Thought distillation, an LLM maps diverse intents to hierarchical SID prefixes, which are then fuzzy-matched to the current news pool to guarantee fully grounded recommendations. Profile-Aware Dual-Signal Reasoning (PADR) further enables cold-start users to obtain valid recommendations using only profiles. On a mainstream Chinese news platform, our 7B model achieves 0% hallucination and 12.4% L1 match in the 152K open-generation SID space (4x random baseline). It matches GPT-4+Hybrid RAG on L1 while surpassing it on finer-grained metrics (L2 2x, Category +1.2pp) at ~100x lower cost. Cold-start users, where existing baselines score 0%, achieve 18.0% L1 (6x random), the highest among all user groups.