InfoAgent: Advancing Autonomous Information-Seeking Agents
作者: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo
分类: cs.CL, cs.AI
发布日期: 2025-09-29
💡 一句话要点
InfoAgent:通过数据合成和自建搜索工具提升自主信息搜寻能力
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自主信息搜寻 大型语言模型 智能体 数据合成 自托管搜索
📋 核心要点
- 现有LLM智能体依赖商业搜索工具,环境透明度低,阻碍能力提升。
- InfoAgent通过数据合成和自建搜索基础设施,提升智能体自主信息搜寻能力。
- InfoAgent在BrowseComp等数据集上超越现有开源智能体,验证了方法的有效性。
📝 摘要(中文)
本文介绍了InfoAgent,一个基于大型语言模型(LLM)的深度研究智能体,它通过创新的数据合成流程和精心设计的网络搜索工具来扩展自身能力。为了构建具有挑战性的、难以找到答案的查询,我们构建了实体树,并应用子树采样和实体模糊化来系统地增加问题的难度。与以往严重依赖商业搜索工具的工作不同,我们开发了一个专用的自托管搜索基础设施,增强了智能体环境的透明度,并促进了智能体能力的进一步发展。我们通过测量正确回答问题所需的平均工具调用次数来评估数据管道的有效性,并表明我们的智能体在配备我们的工具时能产生更好的性能。InfoAgent基于Qwen3-14B进行后训练,采用两阶段方法:冷启动监督微调以灌输长程搜索行为,然后进行强化学习,显著提高推理驱动的工具使用能力。通过我们的方法,InfoAgent在BrowseComp上实现了15.3%的准确率,在BrowseComp-ZH上实现了29.2%的准确率,在Xbench-DS上实现了40.4%的准确率,优于WebSailor-72B和DeepDive-32B等先前的开源深度研究智能体。
🔬 方法详解
问题定义:现有的大型语言模型智能体在进行信息搜寻时,通常依赖于商业搜索引擎,这导致了环境的不透明性,难以对智能体的行为进行深入分析和优化。此外,构建具有挑战性的、需要复杂推理和多步搜索的问题也比较困难。因此,如何构建一个透明、可控且能有效解决复杂信息搜寻问题的智能体是一个关键挑战。
核心思路:InfoAgent的核心思路是构建一个自托管的搜索基础设施,并结合创新的数据合成流程,从而实现对智能体环境的完全控制和对问题难度的系统性提升。通过这种方式,可以更有效地训练智能体,使其具备更强的自主信息搜寻能力。
技术框架:InfoAgent的整体框架包括以下几个主要模块:1) 数据合成管道:用于生成具有挑战性的问题,包括构建实体树、子树采样和实体模糊化等步骤。2) 自托管搜索基础设施:提供透明、可控的搜索环境,允许对搜索结果进行分析和优化。3) 基于Qwen3-14B的智能体:作为基础模型,通过两阶段训练方法进行优化。4) 两阶段训练:包括冷启动监督微调和强化学习,分别用于灌输长程搜索行为和提高推理驱动的工具使用能力。
关键创新:InfoAgent的关键创新在于其数据合成管道和自托管搜索基础设施的结合。数据合成管道能够系统性地生成具有挑战性的问题,而自托管搜索基础设施则提供了透明、可控的搜索环境。这种结合使得智能体能够更有效地学习和优化其信息搜寻策略。与现有方法相比,InfoAgent不再依赖于商业搜索引擎,而是构建了自己的搜索环境,从而实现了更高的透明度和可控性。
关键设计:在数据合成方面,实体树的构建和子树采样策略是关键。实体树用于表示实体之间的关系,而子树采样则用于生成不同的问题。实体模糊化则用于增加问题的难度。在训练方面,冷启动监督微调使用大量数据来初始化智能体的搜索行为,而强化学习则通过奖励机制来鼓励智能体进行更有效的工具使用。具体的损失函数和网络结构细节在论文中未详细说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
InfoAgent在BrowseComp、BrowseComp-ZH和Xbench-DS数据集上分别取得了15.3%、29.2%和40.4%的准确率,显著优于WebSailor-72B和DeepDive-32B等现有开源深度研究智能体。这些结果表明,InfoAgent的数据合成管道和自托管搜索基础设施能够有效提升智能体的自主信息搜寻能力。
🎯 应用场景
InfoAgent的研究成果可应用于多个领域,例如智能客服、研究助手、自动化报告生成等。通过自主信息搜寻,智能体可以帮助用户快速找到所需信息,提高工作效率。此外,该研究也有助于推动通用人工智能的发展,使机器能够更好地理解和利用互联网上的信息。
📄 摘要(原文)
Building Large Language Model agents that expand their capabilities by interacting with external tools represents a new frontier in AI research and applications. In this paper, we introduce InfoAgent, a deep research agent powered by an innovative data synthesis pipeline and orchestrated web search tools. To construct challenging, hard-to-find queries,we build entity trees and apply sub-tree sampling with entity fuzzification to systematically increase question difficulty. Unlike prior work that relies heavily on commercial search tools, we develop a dedicated self-hosted search infrastructure, enhancing transparency of agent environments and facilitating further advancement of agent capacity. We evaluate the effectiveness of our data pipeline by measuring the average number of tool calls required to correctly answer a question, and also show that our agent yields better performance when equipped with our tools. Our \mbox{InfoAgent} is post-trained from Qwen3-14B using a two-stage recipe: cold-start supervised finetuning to instill long-horizon search behaviors, followed by reinforcement learning which significantly improves reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.