Task-Aware LLM Routing with Multi-Level Task-Profile-Guided Data Synthesis for Cold-Start Scenarios
作者: Hui Liu, Bin Zou, Kecheng Chen, Jie Liu, Wenya Wang, Haoliang Li
分类: cs.CL
发布日期: 2026-04-10
备注: 30 pages, Accepted by ACL 2026 Main
💡 一句话要点
提出TRouter,通过多级任务画像引导的数据合成,解决冷启动场景下的LLM路由问题。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型路由 冷启动问题 数据合成 任务画像 任务类型感知
📋 核心要点
- 现有LLM路由方法在冷启动场景下表现不佳,缺乏领域内数据导致泛化能力不足。
- 提出多级任务画像引导的数据合成框架,生成多样化数据以近似真实查询分布,解决冷启动问题。
- TRouter利用合成数据和任务类型信息,建模查询条件下的成本和性能,提升路由效果。
📝 摘要(中文)
大型语言模型(LLM)在不同任务和查询上的性能和计算成本差异显著,因此需要路由系统来选择合适的模型,以满足用户特定的成本-性能权衡。然而,现有的路由器在缺乏领域内训练数据的冷启动场景中泛化能力较差。本文提出了一种多级任务画像引导的数据合成框架,该框架构建了分层的任务分类,并生成多样化的问答对,以近似测试时的查询分布。在此基础上,本文引入了TRouter,一种任务类型感知的路由方法,通过潜在的任务类型变量来建模查询条件下的成本和性能,并利用从合成的任务分类中获得的先验正则化。这种设计增强了TRouter在冷启动和领域内设置下的路由效用。在多个基准测试中,实验结果表明本文的合成框架缓解了冷启动问题,并且TRouter提供了有效的LLM路由。
🔬 方法详解
问题定义:论文旨在解决冷启动场景下,大型语言模型(LLM)路由器的泛化能力不足的问题。现有的LLM路由器依赖于领域内的数据进行训练,但在冷启动场景下,缺乏足够的训练数据,导致路由器无法准确地预测LLM在特定任务上的性能和成本,从而影响路由决策的有效性。
核心思路:论文的核心思路是通过数据合成来模拟目标任务的查询分布,从而缓解冷启动问题。具体来说,论文构建了一个多级任务分类体系,并利用该体系生成多样化的问答对,这些合成数据可以作为训练数据,用于训练LLM路由器,使其能够更好地适应目标任务的特点。同时,论文还利用任务分类体系的信息,对路由器的学习过程进行正则化,从而提高其泛化能力。
技术框架:TRouter的整体框架包括两个主要部分:多级任务画像引导的数据合成和任务类型感知的路由。首先,构建一个分层的任务分类体系,然后利用该体系生成多样化的问答对。这些合成数据用于训练TRouter,TRouter通过潜在的任务类型变量来建模查询条件下的成本和性能。TRouter还利用从合成的任务分类中获得的先验知识进行正则化。
关键创新:论文的关键创新在于提出了多级任务画像引导的数据合成框架,该框架能够有效地生成多样化的、具有代表性的训练数据,从而缓解冷启动问题。此外,论文还提出了任务类型感知的路由方法,该方法能够利用任务分类体系的信息,提高路由器的泛化能力。
关键设计:在数据合成方面,论文设计了一个多级任务分类体系,该体系能够覆盖各种不同的任务类型。在路由方面,论文使用潜在变量模型来建模查询条件下的成本和性能,并使用从任务分类体系中获得的先验知识进行正则化。具体的损失函数和网络结构等技术细节在论文中有详细描述,但摘要中未明确提及。
🖼️ 关键图片
📊 实验亮点
实验结果表明,本文提出的数据合成框架能够有效缓解冷启动问题,TRouter在多个基准测试中均取得了显著的性能提升。具体而言,TRouter在冷启动场景下的路由准确率相比现有方法提升了XX%(具体数值未知,摘要未提供),并且在领域内设置下也表现出良好的性能。
🎯 应用场景
该研究成果可应用于各种需要动态选择LLM的场景,例如智能客服、自动问答系统、内容生成平台等。通过TRouter,系统可以根据用户的具体需求和任务类型,选择最合适的LLM,从而在保证性能的同时,降低计算成本。该研究对于推动LLM在实际应用中的普及具有重要意义。
📄 摘要(原文)
Large language models (LLMs) exhibit substantial variability in performance and computational cost across tasks and queries, motivating routing systems that select models to meet user-specific cost-performance trade-offs. However, existing routers generalize poorly in cold-start scenarios where in-domain training data is unavailable. We address this limitation with a multi-level task-profile-guided data synthesis framework that constructs a hierarchical task taxonomy and produces diverse question-answer pairs to approximate the test-time query distribution. Building on this, we introduce TRouter, a task-type-aware router approach that models query-conditioned cost and performance via latent task-type variables, with prior regularization derived from the synthesized task taxonomy. This design enhances TRouter's routing utility under both cold-start and in-domain settings. Across multiple benchmarks, we show that our synthesis framework alleviates cold-start issues and that TRouter delivers effective LLM routing.