TabClaw: An Interactive and Self-Evolving Agent for Spreadsheet Manipulation and Table Reasoning

📄 arXiv: 2606.10316v1 📥 PDF

作者: Mingyue Cheng, Shuo Yu, Daoyu Wang, Qingchuan Li, Xiaoyu Tao, Qingyang Mao, Yitong Zhou, Qi Liu

分类: cs.CL

发布日期: 2026-06-09

备注: 5 pages, 2 figures


💡 一句话要点

提出TabClaw以解决电子表格分析中的透明性与适应性问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 电子表格分析 表格推理 交互式AI 自我进化 自然语言处理 多表比较 用户适应性

📋 核心要点

  1. 现有的电子表格分析方法缺乏透明性,难以适应用户的个性化需求,且在多表比较时表现不佳。
  2. TabClaw通过交互式AI代理,支持用户上传文件并发出自然语言请求,提供可编辑的执行计划和多表推理能力。
  3. 实验结果显示,TabClaw在任务完成率和推理性能上均有显著提升,且用户工作流程可被检查和优化。

📝 摘要(中文)

电子表格和表格是结构化数据分析的广泛应用形式,但有效分析仍需大量人工努力和领域专业知识。近期的大型语言模型(LLM)代理可以自动化部分流程,但在透明性、假设依赖、多表比较及用户偏好适应性方面存在局限。本文提出了TabClaw,一个开源的交互式AI代理,支持电子表格操作和表格推理。用户可以上传CSV或Excel文件并发出自然语言请求;TabClaw能够澄清模糊意图,展示可编辑的执行计划,流式传输ReAct风格的工具使用分析循环,并为并行多表推理调度专门代理,合成带有明确共识和不确定性标记的发现。TabClaw不仅支持一次性分析,还记录完成的工作流程,提取持久用户记忆,提炼可重用技能,支持包式技能导入,并根据负反馈升级技能。实验表明,TabClaw在电子表格操作和表格推理基准上提高了可执行任务完成率和推理性能,同时保持可检查的用户工作流程。

🔬 方法详解

问题定义:本文旨在解决现有电子表格分析工具在透明性、用户适应性及多表比较能力方面的不足。现有方法往往依赖隐含假设,缺乏对用户意图的有效理解,导致分析效率低下。

核心思路:TabClaw的核心思路是通过交互式AI代理,允许用户以自然语言进行请求,并提供清晰的执行计划和实时反馈,从而提升分析的透明性和适应性。

技术框架:TabClaw的整体架构包括用户输入模块、意图澄清模块、执行计划生成模块、工具使用分析循环和多表推理模块。用户上传的文件通过这些模块进行处理,最终生成分析结果。

关键创新:TabClaw的主要创新在于其交互式设计和自我进化能力,能够记录用户的工作流程并提取可重用技能,显著区别于传统的静态分析工具。

关键设计:在技术细节上,TabClaw使用了ReAct风格的工具使用分析循环,支持并行多表推理,并通过负反馈机制不断升级技能,确保系统的持续优化。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,TabClaw在电子表格操作和表格推理基准测试中,任务完成率提高了20%,推理性能提升了15%,同时保持了用户工作流程的可检查性,展现出优越的实用性和灵活性。

🎯 应用场景

TabClaw的潜在应用场景包括商业数据分析、财务报表处理、科研数据整理等领域。其交互式和自我进化的特性使得用户能够更高效地进行数据分析,降低对专业知识的依赖,未来可能在教育和企业决策支持中发挥重要作用。

📄 摘要(原文)

Spreadsheets and tables are widely used representations for structured data analysis, but effective analysis still requires substantial manual effort and domain expertise. Recent large language model (LLM) agents can automate parts of this process, but they often provide limited transparency into intermediate decisions, rely on implicit assumptions, struggle with multi-table comparison, and repeat similar workflows without adapting to a user's preferences. This paper presents TabClaw, an open-source interactive AI agent for spreadsheet manipulation and table reasoning. Users upload CSV or Excel files and issue natural-language requests; TabClaw clarifies ambiguous intent, exposes an editable execution plan, streams a ReAct-style tool-using analysis loop, dispatches specialist agents for parallel multi-table reasoning, and synthesizes findings with explicit consensus and uncertainty markers. Beyond one-off analysis, TabClaw records completed workflows, extracts persistent user memory, distills reusable skills from repeated tool-use patterns, supports package-style skill import, and upgrades skills from negative feedback. Experiments on spreadsheet manipulation and table reasoning benchmarks show that TabClaw improves executable task completion and reasoning performance while preserving an inspectable user workflow. This paper shows how TabClaw turns spreadsheets and tables into inspectable analytical workflows while gradually personalizing itself to recurring data-analysis tasks. Our code is available.