Task-Aware LLM Routing with Multi-Level Task-Profile-Guided Data Synthesis for Cold-Start Scenarios

作者: Hui Liu, Bin Zou, Kecheng Chen, Jie Liu, Wenya Wang, Haoliang Li

分类: cs.CL

发布日期: 2026-04-10

备注: 30 pages, Accepted by ACL 2026 Main

💡 一句话要点

提出TRouter，通过多级任务画像引导的数据合成，解决冷启动场景下的LLM路由问题。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型路由 冷启动问题 数据合成 任务画像 任务类型感知

📋 核心要点

现有LLM路由方法在冷启动场景下表现不佳，缺乏领域内数据导致泛化能力不足。
提出多级任务画像引导的数据合成框架，生成多样化数据以近似真实查询分布，解决冷启动问题。
TRouter利用合成数据和任务类型信息，建模查询条件下的成本和性能，提升路由效果。

📝 摘要（中文）

大型语言模型（LLM）在不同任务和查询上的性能和计算成本差异显著，因此需要路由系统来选择合适的模型，以满足用户特定的成本-性能权衡。然而，现有的路由器在缺乏领域内训练数据的冷启动场景中泛化能力较差。本文提出了一种多级任务画像引导的数据合成框架，该框架构建了分层的任务分类，并生成多样化的问答对，以近似测试时的查询分布。在此基础上，本文引入了TRouter，一种任务类型感知的路由方法，通过潜在的任务类型变量来建模查询条件下的成本和性能，并利用从合成的任务分类中获得的先验正则化。这种设计增强了TRouter在冷启动和领域内设置下的路由效用。在多个基准测试中，实验结果表明本文的合成框架缓解了冷启动问题，并且TRouter提供了有效的LLM路由。

🔬 方法详解

问题定义：论文旨在解决冷启动场景下，大型语言模型（LLM）路由器的泛化能力不足的问题。现有的LLM路由器依赖于领域内的数据进行训练，但在冷启动场景下，缺乏足够的训练数据，导致路由器无法准确地预测LLM在特定任务上的性能和成本，从而影响路由决策的有效性。

核心思路：论文的核心思路是通过数据合成来模拟目标任务的查询分布，从而缓解冷启动问题。具体来说，论文构建了一个多级任务分类体系，并利用该体系生成多样化的问答对，这些合成数据可以作为训练数据，用于训练LLM路由器，使其能够更好地适应目标任务的特点。同时，论文还利用任务分类体系的信息，对路由器的学习过程进行正则化，从而提高其泛化能力。

技术框架：TRouter的整体框架包括两个主要部分：多级任务画像引导的数据合成和任务类型感知的路由。首先，构建一个分层的任务分类体系，然后利用该体系生成多样化的问答对。这些合成数据用于训练TRouter，TRouter通过潜在的任务类型变量来建模查询条件下的成本和性能。TRouter还利用从合成的任务分类中获得的先验知识进行正则化。

关键创新：论文的关键创新在于提出了多级任务画像引导的数据合成框架，该框架能够有效地生成多样化的、具有代表性的训练数据，从而缓解冷启动问题。此外，论文还提出了任务类型感知的路由方法，该方法能够利用任务分类体系的信息，提高路由器的泛化能力。

关键设计：在数据合成方面，论文设计了一个多级任务分类体系，该体系能够覆盖各种不同的任务类型。在路由方面，论文使用潜在变量模型来建模查询条件下的成本和性能，并使用从任务分类体系中获得的先验知识进行正则化。具体的损失函数和网络结构等技术细节在论文中有详细描述，但摘要中未明确提及。

🖼️ 关键图片

📊 实验亮点

实验结果表明，本文提出的数据合成框架能够有效缓解冷启动问题，TRouter在多个基准测试中均取得了显著的性能提升。具体而言，TRouter在冷启动场景下的路由准确率相比现有方法提升了XX%（具体数值未知，摘要未提供），并且在领域内设置下也表现出良好的性能。

🎯 应用场景

该研究成果可应用于各种需要动态选择LLM的场景，例如智能客服、自动问答系统、内容生成平台等。通过TRouter，系统可以根据用户的具体需求和任务类型，选择最合适的LLM，从而在保证性能的同时，降低计算成本。该研究对于推动LLM在实际应用中的普及具有重要意义。

📄 摘要（原文）

Large language models (LLMs) exhibit substantial variability in performance and computational cost across tasks and queries, motivating routing systems that select models to meet user-specific cost-performance trade-offs. However, existing routers generalize poorly in cold-start scenarios where in-domain training data is unavailable. We address this limitation with a multi-level task-profile-guided data synthesis framework that constructs a hierarchical task taxonomy and produces diverse question-answer pairs to approximate the test-time query distribution. Building on this, we introduce TRouter, a task-type-aware router approach that models query-conditioned cost and performance via latent task-type variables, with prior regularization derived from the synthesized task taxonomy. This design enhances TRouter's routing utility under both cold-start and in-domain settings. Across multiple benchmarks, we show that our synthesis framework alleviates cold-start issues and that TRouter delivers effective LLM routing.

Task-Aware LLM Routing with Multi-Level Task-Profile-Guided Data Synthesis for Cold-Start Scenarios

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理