SIA: A Synthesize-Inject-Align Framework for Knowledge-Grounded and Secure E-commerce Search LLMs with Industrial Deployment

📄 arXiv: 2603.16137v1 📥 PDF

作者: Zhouwei Zhai, Mengxiang Chen, Anmeng Zhang

分类: cs.CL

发布日期: 2026-03-17


💡 一句话要点

提出SIA框架,解决电商搜索LLM的知识幻觉和安全漏洞问题,已在京东部署。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 电商搜索 大型语言模型 知识幻觉 安全漏洞 知识图谱 指令调优 对抗训练

📋 核心要点

  1. 电商搜索LLM面临知识幻觉和安全漏洞两大挑战,阻碍了其工业部署。
  2. SIA框架通过合成知识、注入领域知识和对齐任务目标与安全目标,构建知识丰富且安全的LLM。
  3. SIA框架已在京东部署,并在多个搜索场景的A/B测试中显著提升了关键业务指标。

📝 摘要(中文)

大型语言模型为电商搜索带来了变革性潜力,能够实现感知意图的推荐。然而,由于动态、细粒度产品知识编码不足导致的知识幻觉,以及威胁合规性的jailbreak攻击下的安全漏洞,阻碍了它们在工业界的部署。为了解决这些问题,我们提出了SIA——一个用于构建知识丰富且安全的电商搜索LLM的Synthesize-Inject-Align框架。我们的方法首先通过将结构化知识图与非结构化行为日志相结合,并辅以推理链和安全感知数据,来合成高质量的自然语言语料库。然后,我们引入了一种基于深度向上扩展的参数高效预训练策略,以注入领域知识,同时保留通用能力。最后,一种通过多任务指令调优和对抗训练的双路径对齐方法,增强了任务性能和安全鲁棒性。该框架已在中国最大的自营电商平台京东部署,在五个核心搜索场景中的A/B测试表明,关键业务指标显著改善,验证了其工业有效性和可扩展性。

🔬 方法详解

问题定义:现有电商搜索LLM面临两大问题:一是知识幻觉,由于缺乏对动态、细粒度产品知识的有效编码,导致生成不准确或虚假的信息;二是安全漏洞,容易受到jailbreak攻击,产生不合规或有害的内容。这些问题严重阻碍了LLM在电商搜索场景的实际应用。

核心思路:SIA框架的核心思路是“合成-注入-对齐”。首先,通过合成高质量的领域知识语料来增强LLM的知识储备;然后,通过参数高效的预训练方法将领域知识注入到LLM中,同时保持其通用能力;最后,通过多任务学习和对抗训练对齐LLM的任务性能和安全鲁棒性。

技术框架:SIA框架包含三个主要阶段:1) 知识合成(Synthesize):结合结构化知识图和非结构化行为日志,生成包含推理链和安全感知数据的高质量自然语言语料库。2) 知识注入(Inject):采用基于深度向上扩展的参数高效预训练策略,将领域知识注入到LLM中。3) 知识对齐(Align):通过多任务指令调优和对抗训练,增强LLM的任务性能和安全鲁棒性。

关键创新:SIA框架的关键创新在于其综合性的解决方案,它不仅关注知识增强,还同时关注安全问题。深度向上扩展的预训练方法和双路径对齐方法是两个重要的技术创新点。深度向上扩展预训练在参数效率和知识注入之间取得了平衡。双路径对齐方法同时优化任务性能和安全鲁棒性,解决了两者之间的trade-off。

关键设计:在知识合成阶段,如何有效地融合结构化知识图和非结构化行为日志是一个关键设计。在知识注入阶段,深度向上扩展的具体层数和训练策略需要仔细调整。在知识对齐阶段,多任务指令调优的任务选择和对抗训练的攻击方法是关键设计。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

SIA框架已在京东的五个核心搜索场景中进行了A/B测试,结果表明关键业务指标得到了显著改善。具体的性能数据和提升幅度未在摘要中明确给出,但强调了其工业有效性和可扩展性,表明SIA框架在实际应用中取得了显著成果。

🎯 应用场景

该研究成果可广泛应用于电商搜索、智能客服、商品推荐等领域。通过提升LLM的知识准确性和安全性,可以改善用户体验,提高转化率,并降低安全风险。未来,该框架可以扩展到其他领域,例如金融、医疗等,构建更加可靠和安全的LLM应用。

📄 摘要(原文)

Large language models offer transformative potential for e-commerce search by enabling intent-aware recommendations. However, their industrial deployment is hindered by two critical challenges: (1) knowledge hallucination due to insufficient encoding of dynamic, fine-grained product knowledge, and (2) security vulnerabilities under jailbreak attacks that threaten compliance. To address these issues, we propose SI--a Synthesize-Inject-Align framework for building knowledgeable and secure e-commerce search LLMs. Our approach first synthesizes high-quality natural language corpus by combining structured knowledge graphs with unstructured behavioral logs, augmented with reasoning chains and safety-aware data.We then introduce a parameter-efficient pre-training strategy based on Depth Up-Scaling to inject domain knowledge while preserving general capabilities. Finally, a dual-path alignment method via multi-task instruction tuning and adversarial training strengthens both task performance and safety robustness. The framework has been deployed at JD.com, China's largest self-operated e-commerce platform, where A/B tests across five core search scenarios demonstrate significant improvements in key business metrics, validating its industrial effectiveness and scalability.