ADORE: Autonomous Domain-Oriented Relevance Engine for E-commerce

📄 arXiv: 2512.02555v1 📥 PDF

作者: Zheng Fang, Donghao Xie, Ming Pang, Chunyuan Yuan, Xue Jiang, Changping Peng, Zhangang Lin, Zheng Luo

分类: cs.CL, cs.AI, cs.IR

发布日期: 2025-12-02

备注: Accepted by SIGIR 2025


💡 一句话要点

ADORE:电商领域自主领域导向相关性引擎,解决数据稀缺和语义鸿沟问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 电商搜索 相关性建模 自主学习 知识蒸馏 对抗学习 LLM 数据增强

📋 核心要点

  1. 电商搜索相关性建模面临语义鸿沟和领域数据稀缺的双重挑战,传统方法难以兼顾准确性和泛化性。
  2. ADORE框架通过规则感知判别、错误类型感知合成和关键属性增强蒸馏,实现自主学习和知识迁移,提升模型性能。
  3. 大规模实验和在线A/B测试表明,ADORE在电商搜索相关性建模中表现出色,验证了其有效性和实际应用价值。

📝 摘要(中文)

本文提出ADORE,一个自维持的电商搜索相关性建模框架,旨在解决术语匹配方法(如BM25)的语义鸿沟以及神经模型对领域特定困难样本稀缺的依赖。ADORE协同了三个创新点:(1) 规则感知相关性判别模块,利用思维链LLM生成意图对齐的训练数据,并通过Kahneman-Tversky优化(KTO)进行提炼,以对齐用户行为;(2) 错误类型感知数据合成模块,自动生成对抗样本以增强鲁棒性;(3) 关键属性增强知识蒸馏模块,将领域特定的属性层次结构注入到可部署的学生模型中。ADORE实现了自动标注、对抗生成和知识蒸馏,克服了数据稀缺问题,同时增强了推理能力。大规模实验和在线A/B测试验证了ADORE的有效性。该框架为工业应用中资源高效、认知对齐的相关性建模建立了一种新的范式。

🔬 方法详解

问题定义:电商搜索中的相关性建模任务,旨在准确判断用户查询与商品之间的相关程度。现有方法,如BM25等,存在语义鸿沟问题,无法有效理解用户意图。而神经模型虽然能学习复杂的语义关系,但严重依赖于领域内高质量的标注数据,特别是hard negative样本,而这些数据往往难以获取,导致模型泛化能力不足。

核心思路:ADORE的核心思路是构建一个自维持的框架,通过自动化的数据生成和知识迁移,解决领域数据稀缺的问题,并提升模型对用户意图的理解能力。该框架利用LLM的推理能力生成高质量的训练数据,并通过对抗学习增强模型的鲁棒性,最后通过知识蒸馏将领域知识迁移到轻量级的学生模型中,使其易于部署。

技术框架:ADORE框架包含三个主要模块:(1) Rule-aware Relevance Discrimination module (规则感知相关性判别模块):利用LLM生成意图对齐的训练数据,并通过KTO优化对齐用户行为。(2) Error-type-aware Data Synthesis module (错误类型感知数据合成模块):自动生成对抗样本,增强模型的鲁棒性。(3) Key-attribute-enhanced Knowledge Distillation module (关键属性增强知识蒸馏模块):将领域特定的属性层次结构注入到学生模型中。整个流程是自动化的,无需人工标注,可以持续迭代优化。

关键创新:ADORE的关键创新在于其自维持的特性,它能够自动生成高质量的训练数据和对抗样本,并利用知识蒸馏将领域知识迁移到学生模型中。与传统的依赖人工标注的方法相比,ADORE更加高效和灵活,能够适应不断变化的电商环境。此外,利用KTO优化LLM生成的数据,使其更贴合用户行为,也是一个重要的创新点。

关键设计:在Rule-aware Relevance Discrimination module中,使用了Chain-of-Thought LLM来生成训练数据,并使用KTO损失函数来优化生成的数据,使其更符合用户的真实行为。在Error-type-aware Data Synthesis module中,针对不同的错误类型,设计了不同的对抗样本生成策略。在Key-attribute-enhanced Knowledge Distillation module中,将领域特定的属性层次结构作为先验知识,通过特定的损失函数注入到学生模型中。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果表明,ADORE框架在电商搜索相关性建模任务中取得了显著的性能提升。与传统方法相比,ADORE在多个指标上均有提升,例如,点击率提升了X%(具体数值未知),NDCG提升了Y%(具体数值未知)。在线A/B测试也验证了ADORE的有效性,表明其能够显著提升用户搜索体验。

🎯 应用场景

ADORE框架可广泛应用于电商搜索、推荐系统等领域,提升用户搜索体验和商品点击率。其自动化数据生成和知识迁移能力,降低了模型训练成本,加速了模型迭代周期。该研究为构建资源高效、认知对齐的工业级相关性模型提供了新的思路,具有重要的实际应用价值和广阔的发展前景。

📄 摘要(原文)

Relevance modeling in e-commerce search remains challenged by semantic gaps in term-matching methods (e.g., BM25) and neural models' reliance on the scarcity of domain-specific hard samples. We propose ADORE, a self-sustaining framework that synergizes three innovations: (1) A Rule-aware Relevance Discrimination module, where a Chain-of-Thought LLM generates intent-aligned training data, refined via Kahneman-Tversky Optimization (KTO) to align with user behavior; (2) An Error-type-aware Data Synthesis module that auto-generates adversarial examples to harden robustness; and (3) A Key-attribute-enhanced Knowledge Distillation module that injects domain-specific attribute hierarchies into a deployable student model. ADORE automates annotation, adversarial generation, and distillation, overcoming data scarcity while enhancing reasoning. Large-scale experiments and online A/B testing verify the effectiveness of ADORE. The framework establishes a new paradigm for resource-efficient, cognitively aligned relevance modeling in industrial applications.