RAG-Enhanced Large Language Models for Dynamic Content Expiration Prediction in Web Search

📄 arXiv: 2605.13052v1 📥 PDF

作者: Tingyu Chen, Wenkai Zhang, Li Gao, Lixin Su, Ge Chen, Dawei Yin, Daiting Shi

分类: cs.IR, cs.CL

发布日期: 2026-05-13

备注: Accepted at SIGIR 2026. Final version: https://doi.org/10.1145/3805712.3808457


💡 一句话要点

提出基于RAG增强的大语言模型,用于Web搜索中动态内容过期预测

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 信息检索 内容时效性 动态过期预测 查询理解

📋 核心要点

  1. 传统Web搜索依赖静态时间窗口过滤,无法准确判断内容是否语义过期,导致用户体验下降。
  2. 论文提出基于RAG增强的LLM框架,通过提取时间上下文并推理查询相关的“有效性范围”,实现动态过期预测。
  3. 在线A/B测试表明,该方法显著提升了搜索新鲜度和用户体验指标,验证了其在工业规模上的有效性。

📝 摘要(中文)

本文提出了一种基于大语言模型(LLM)的查询感知动态内容过期预测框架,并将其部署在百度搜索中,旨在解决商业Web搜索中内容时效性与用户意图对齐的难题。传统方法依赖于静态时间窗口过滤,导致“一刀切”式的排序,使得时间上较新但语义上过期的内容仍然被展示。该框架从文档中提取细粒度的时间上下文,并利用LLM推断查询特定的“有效性范围”,即基于用户意图定义信息何时过时的语义边界。该方法集成了强大的幻觉缓解策略以确保可靠性,并通过在线A/B测试在实际生产流量上进行了评估。结果表明,搜索新鲜度和用户体验指标均得到显著改善,验证了LLM驱动的推理在工业规模上解决语义过期问题的有效性。

🔬 方法详解

问题定义:传统Web搜索中,判断内容时效性通常采用静态时间窗口过滤方法。这种方法无法根据用户查询意图动态调整内容的时效性判断标准,导致一些虽然时间上较新但语义上已经过时的内容仍然被优先展示,影响用户体验。因此,需要一种能够根据用户查询动态判断内容是否过期的机制。

核心思路:论文的核心思路是将内容时效性判断问题转化为一个动态的有效性推理任务。通过利用大语言模型(LLM)的推理能力,结合从文档中提取的细粒度时间上下文,为每个查询动态地推断出一个“有效性范围”。这个范围定义了在特定查询意图下,信息何时会变得过时。

技术框架:该框架主要包含以下几个模块:1) 文档时间上下文提取:从Web文档中提取与时间相关的信息,例如发布日期、更新日期、事件发生时间等。2) 查询理解:理解用户查询的意图,包括查询的主题、范围和期望的时效性。3) LLM推理:利用LLM,结合文档的时间上下文和查询意图,推理出一个查询特定的“有效性范围”。4) 幻觉缓解:采用策略来减少LLM可能产生的幻觉,确保推理结果的可靠性。5) 排序:根据内容是否在“有效性范围”内,调整搜索结果的排序。

关键创新:该论文的关键创新在于将内容时效性判断问题转化为一个动态的有效性推理任务,并利用LLM的推理能力来解决这个问题。与传统的静态时间窗口过滤方法相比,该方法能够根据用户查询的意图动态调整内容的时效性判断标准,从而更准确地判断内容是否过期。此外,论文还提出了幻觉缓解策略,提高了LLM推理结果的可靠性。

关键设计:论文中没有详细描述具体的参数设置、损失函数或网络结构等技术细节。但是,幻觉缓解策略是关键设计之一,具体实现方式未知。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

该研究在百度搜索的实际生产流量上进行了在线A/B测试,结果表明,该方法显著提升了搜索新鲜度和用户体验指标。具体的性能数据和提升幅度未知,但结果验证了LLM驱动的推理在工业规模上解决语义过期问题的有效性。

🎯 应用场景

该研究成果可广泛应用于各类搜索引擎、问答系统和信息检索系统,提升搜索结果的时效性和相关性。通过更准确地判断内容是否过期,可以显著改善用户体验,提高用户满意度。未来,该技术还可扩展到其他领域,例如新闻推荐、社交媒体内容过滤等,帮助用户获取更及时、更有效的信息。

📄 摘要(原文)

In commercial web search, aligning content freshness with user intent remains challenging due to the highly varied lifespans of information. Traditional industrial approaches rely on static time-window filtering, resulting in "one-size-fits-all" rankings where content may be chronologically recent but semantically expired. To address the limitation, we present a novel Large Language Models (LLMs)-based Query-Aware Dynamic Content Expiration Prediction Framework deployed in Baidu search, reformulating timeliness as a dynamic validity inference task. Our framework extracts fine-grained temporal contexts from documents and leverages LLMs to deduce a query-specific "validity horizon"-a semantic boundary defining when information becomes obsolete based on user intent. Integrated with robust hallucination mitigation strategies to ensure reliability, our approach has been evaluated through offline and online A/B testing on live production traffic. Results demonstrate significant improvements in search freshness and user experience metrics, validating the effectiveness of LLM-driven reasoning for solving semantic expiration at an industrial scale.