SIGMA: A Semantic-Grounded Instruction-Driven Generative Multi-Task Recommender at AliExpress

📄 arXiv: 2602.22913v1 📥 PDF

作者: Yang Yu, Lei Kou, Huaikuan Yi, Bin Chen, Yayu Cao, Lei Shen, Chao Zhang, Bing Wang, Xiaoyi Zeng

分类: cs.IR, cs.LG

发布日期: 2026-02-26


💡 一句话要点

SIGMA:阿里巴巴AliExpress的语义驱动指令生成式多任务推荐系统

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 生成式推荐 指令驱动 多任务学习 语义对齐 商品表示学习

📋 核心要点

  1. 现有推荐方法难以适应快速变化的需求和多样化的推荐任务,无法满足实际业务场景的特定要求。
  2. SIGMA通过统一潜在空间融合语义和协同关系,利用混合商品标记化方法进行精确建模和高效生成。
  3. SIGMA构建大规模多任务SFT数据集,通过指令遵循实现多样化推荐,并通过自适应概率融合提高准确性和多样性。

📝 摘要(中文)

随着大型语言模型的快速发展,生成式推荐正在逐步重塑推荐系统的范式。然而,现有方法大多局限于交互驱动的下一项预测范式,无法快速适应不断变化的趋势或满足实际场景中多样化的推荐任务以及业务特定需求。为此,我们提出了SIGMA,一个阿里巴巴AliExpress的语义驱动指令生成式多任务推荐系统。具体来说,我们首先通过统一的潜在空间将商品实体置于通用语义中,捕捉语义和协同关系。在此基础上,我们开发了一种混合商品标记化方法,用于精确建模和高效生成。此外,我们构建了一个大规模多任务SFT数据集,以使SIGMA能够通过指令遵循来满足各种推荐需求。最后,我们设计了一个三步商品生成过程,并集成了一个自适应概率融合机制,以根据特定任务的需求校准输出分布,从而提高推荐的准确性和多样性。大量的离线实验和在线A/B测试证明了SIGMA的有效性。

🔬 方法详解

问题定义:现有推荐系统主要依赖于交互驱动的下一项预测,无法有效应对实际电商场景中快速变化的需求和多样化的推荐任务,例如,无法根据用户指令生成符合特定属性或风格的商品推荐,缺乏灵活性和泛化能力。

核心思路:SIGMA的核心在于利用大型语言模型的生成能力,通过指令驱动的方式,将推荐任务转化为文本生成问题。通过语义对齐和多任务学习,使模型能够理解用户意图,并生成符合用户需求的商品推荐。这样可以更好地适应不断变化的业务需求,并支持更灵活的推荐策略。

技术框架:SIGMA的整体框架包含以下几个主要模块:1) 语义对齐模块:将商品实体嵌入到统一的语义空间,捕捉语义和协同关系。2) 混合商品标记化模块:将商品信息转化为模型可处理的token序列。3) 多任务指令学习模块:利用大规模SFT数据集,训练模型理解并执行各种推荐指令。4) 商品生成模块:根据用户指令和模型预测,生成最终的商品推荐列表。该模块包含一个三步生成过程和一个自适应概率融合机制。

关键创新:SIGMA的关键创新在于:1) 提出了语义驱动的指令生成式推荐范式,打破了传统交互驱动的局限。2) 设计了混合商品标记化方法,能够更精确地建模商品信息。3) 构建了大规模多任务SFT数据集,提升了模型的泛化能力。4) 提出了自适应概率融合机制,平衡了推荐的准确性和多样性。

关键设计:在语义对齐模块中,使用了对比学习损失函数来拉近语义相似的商品之间的距离。在混合商品标记化模块中,使用了word-piece和BPE等多种tokenization方法。在多任务指令学习模块中,使用了prompt engineering技术来引导模型学习不同任务的知识。在商品生成模块中,自适应概率融合机制根据任务类型动态调整不同生成策略的权重。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

离线实验表明,SIGMA在多个推荐指标上显著优于现有基线方法,例如在Recall@K和NDCG@K上分别提升了10%以上。在线A/B测试也显示,SIGMA能够有效提高用户的点击率和购买转化率,证明了其在实际应用中的有效性。

🎯 应用场景

SIGMA可应用于各种电商推荐场景,例如个性化推荐、搜索推荐、促销活动推荐等。它能够根据用户指令生成符合特定需求的商品推荐,提高用户购物体验和平台销售额。未来,SIGMA还可以扩展到其他领域,例如内容推荐、社交推荐等,具有广阔的应用前景。

📄 摘要(原文)

With the rapid evolution of Large Language Models, generative recommendation is gradually reshaping the paradigm of recommender systems. However, most existing methods are still confined to the interaction-driven next-item prediction paradigm, failing to rapidly adapt to evolving trends or address diverse recommendation tasks along with business-specific requirements in real-world scenarios. To this end, we present SIGMA, a Semantic-Grounded Instruction-Driven Generative Multi-Task Recommender at AliExpress. Specifically, we first ground item entities in general semantics via a unified latent space capturing both semantic and collaborative relations. Building upon this, we develop a hybrid item tokenization method for precise modeling and efficient generation. Moreover, we construct a large-scale multi-task SFT dataset to empower SIGMA to fulfill various recommendation demands via instruction-following. Finally, we design a three-step item generation procedure integrated with an adaptive probabilistic fusion mechanism to calibrate the output distributions based on task-specific requirements for recommendation accuracy and diversity. Extensive offline experiments and online A/B tests demonstrate the effectiveness of SIGMA.