TabAgent: A Framework for Replacing Agentic Generative Components with Tabular-Textual Classifiers

作者: Ido Levy, Eilam Shapira, Yinon Goldshtein, Avi Yaeli, Nir Mashkif, Segev Shlomov

分类: cs.CL

发布日期: 2026-02-18

💡 一句话要点

TabAgent框架用表格文本分类器替换Agentic系统中生成式组件，显著降低延迟和成本。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: Agentic系统 大语言模型 表格文本分类 判别式模型 生成式模型 延迟优化 成本降低

📋 核心要点

Agentic系统依赖LLM进行决策，但重复调用导致高延迟和高成本，限制了实际应用。
TabAgent框架通过训练表格文本分类器，替换Agentic系统中耗时的生成式决策组件。
实验表明，TabAgent在保持任务成功率的同时，显著降低了延迟和推理成本。

📝 摘要（中文）

Agentic系统是一种AI架构，它自主执行多步骤工作流程以实现复杂目标。这类系统通常使用重复的大语言模型（LLM）调用来完成闭集决策任务，例如路由、筛选、门控和验证。这种设计虽然方便，但由于累积延迟和token使用量，导致部署速度慢且成本高昂。我们提出了TabAgent，一个框架，用于将闭集选择任务中的生成式决策组件替换为基于执行轨迹训练的紧凑型文本表格分类器。TabAgent (i) 从轨迹中提取结构化模式、状态和依赖关系特征（TabSchema），(ii) 使用模式对齐的合成监督来增强覆盖率（TabSynth），以及 (iii) 使用轻量级分类器对候选对象进行评分（TabHead）。在长时程AppWorld基准测试中，TabAgent在保持任务级成功率的同时，消除了筛选时的LLM调用，从而将延迟降低了约95%，推理成本降低了85-91%。除了工具筛选之外，TabAgent还可以推广到其他agentic决策头，从而为生产agent架构中生成式瓶颈的学习判别式替换建立了一种范例。

🔬 方法详解

问题定义：Agentic系统在执行复杂任务时，通常依赖大语言模型（LLM）进行闭集决策，例如工具选择和验证。然而，频繁调用LLM会导致显著的延迟和高昂的计算成本，成为系统性能的瓶颈。现有方法缺乏高效的替代方案，难以在实际生产环境中部署。

核心思路：TabAgent的核心思想是利用判别式模型（表格文本分类器）来替代生成式模型（LLM）在闭集决策任务中的作用。通过学习历史执行轨迹，分类器能够直接预测最佳决策，避免了LLM的推理过程，从而降低延迟和成本。这种方法的核心在于将复杂的生成过程转化为简单的分类问题。

技术框架：TabAgent框架包含三个主要模块：TabSchema、TabSynth和TabHead。TabSchema负责从Agentic系统的执行轨迹中提取结构化的模式、状态和依赖关系特征，形成表格数据。TabSynth通过生成与模式对齐的合成数据来增强训练数据的覆盖范围，解决数据稀疏问题。TabHead是一个轻量级的分类器，用于根据TabSchema和TabSynth生成的数据对候选对象进行评分，从而做出决策。

关键创新：TabAgent的关键创新在于使用表格文本分类器来替代Agentic系统中的生成式决策组件。这种方法不仅降低了延迟和成本，还提高了系统的可解释性和可控性。此外，TabAgent还提出了TabSchema和TabSynth两种技术，用于提取结构化特征和生成合成数据，从而增强了分类器的性能。

关键设计：TabSchema的设计需要仔细考虑哪些特征能够有效表示Agentic系统的状态和依赖关系。TabSynth的设计需要保证生成的合成数据与真实数据具有相似的分布，避免引入偏差。TabHead可以使用各种轻量级的分类器，例如线性模型或小型神经网络。损失函数可以选择交叉熵损失或hinge loss等。

📊 实验亮点

在AppWorld基准测试中，TabAgent在保持任务级成功率的同时，消除了筛选时的LLM调用，将延迟降低了约95%，推理成本降低了85-91%。这些结果表明，TabAgent是一种高效且有效的Agentic系统优化方法，具有显著的性能提升。

🎯 应用场景

TabAgent可应用于各种Agentic系统，例如智能助手、自动化客服和机器人流程自动化（RPA）。通过降低延迟和成本，TabAgent可以提高这些系统的响应速度和效率，使其更易于部署和扩展。此外，TabAgent还可以用于优化Agentic系统的决策过程，提高任务成功率。

📄 摘要（原文）

Agentic systems, AI architectures that autonomously execute multi-step workflows to achieve complex goals, are often built using repeated large language model (LLM) calls for closed-set decision tasks such as routing, shortlisting, gating, and verification. While convenient, this design makes deployments slow and expensive due to cumulative latency and token usage. We propose TabAgent, a framework for replacing generative decision components in closed-set selection tasks with a compact textual-tabular classifier trained on execution traces. TabAgent (i) extracts structured schema, state, and dependency features from trajectories (TabSchema), (ii) augments coverage with schema-aligned synthetic supervision (TabSynth), and (iii) scores candidates with a lightweight classifier (TabHead). On the long-horizon AppWorld benchmark, TabAgent maintains task-level success while eliminating shortlist-time LLM calls, reducing latency by approximately 95% and inference cost by 85-91%. Beyond tool shortlisting, TabAgent generalizes to other agentic decision heads, establishing a paradigm for learned discriminative replacements of generative bottlenecks in production agent architectures.

TabAgent: A Framework for Replacing Agentic Generative Components with Tabular-Textual Classifiers

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理