Beyond Text-to-SQL: An Agentic LLM System for Governed Enterprise Analytics APIs

📄 arXiv: 2605.21027v1 📥 PDF

作者: Gundeep Singh, Parsa Kavehzadeh, Jing Xia, Xue-Yong Fu, Julien Bouvier Tremblay, Md Tahmid Rahman Laskar, Vincent Lum, Shashi Bhushan TN

分类: cs.CL, cs.AI

发布日期: 2026-05-20

备注: The first four authors contributed equally to this work


💡 一句话要点

提出 Analytic Agent,利用LLM驱动的企业分析API智能体系统,解决传统Text-to-SQL在企业级应用中的局限性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 企业分析 Text-to-SQL API智能体 自然语言处理

📋 核心要点

  1. 传统BI工具和Text-to-SQL系统难以满足非技术用户访问企业数据的需求,尤其是在需要复杂业务逻辑和权限控制的企业环境中。
  2. Analytic Agent 提出了一种基于 LLM 的智能体系统,通过与受治理的企业分析 API 安全交互,将自然语言意图转化为可执行的查询和可视化。
  3. 在90个真实企业用例的评估中,Analytic Agent 能够可靠地解释用户目标、验证权限、执行查询并生成符合规范的可视化结果。

📝 摘要(中文)

企业分析旨在使组织数据可用于决策,但非技术用户在使用传统商业智能工具或Text-to-SQL系统时仍然面临障碍。虽然最近基于大型语言模型(LLM)的Text-to-SQL方法有望实现对结构化数据的自然语言访问,但它们在企业环境中存在不足,因为企业分析管道依赖于受治理的API而不是原始数据库。实际上,这些API封装了复杂的业务逻辑,以确保一致性、可审计性和安全性。然而,将数学或聚合逻辑委托给LLM会带来可靠性和合规性风险。为此,我们提出了Analytic Agent,这是一个基于LLM的智能体系统,可将自然语言意图转换为与企业分析API的安全交互。在领域专家构建的90个真实企业用例中进行评估,它通过多步骤推理和策略感知编排,可靠地解释用户目标,验证权限,执行受治理的查询,并生成符合规范的可视化。

🔬 方法详解

问题定义:现有Text-to-SQL方法在企业级应用中存在局限性,主要体现在两个方面:一是直接操作原始数据库缺乏企业级的权限控制和数据一致性保障;二是将复杂的数学和聚合逻辑委托给LLM存在可靠性和合规性风险。因此,需要一种能够利用企业已有的、受治理的分析API,并能安全可靠地将自然语言转化为API调用的方法。

核心思路:Analytic Agent 的核心思路是利用 LLM 作为智能体,负责理解用户意图、进行多步骤推理、验证权限,并将用户请求转化为对企业分析 API 的安全调用。通过与受治理的 API 交互,确保数据的一致性、可审计性和安全性,同时避免 LLM 直接处理敏感数据或复杂计算。

技术框架:Analytic Agent 的整体架构包含以下主要模块:1) 意图理解模块:利用 LLM 理解用户的自然语言查询,提取用户意图和所需的数据;2) 权限验证模块:根据用户身份和请求的数据,验证用户是否具有访问权限;3) API 调用编排模块:将用户意图转化为对企业分析 API 的一系列调用,并按照正确的顺序执行;4) 结果可视化模块:将 API 返回的数据进行可视化,并以用户友好的方式呈现。

关键创新:Analytic Agent 的关键创新在于将 LLM 作为智能体,与受治理的企业分析 API 集成,实现安全可靠的自然语言数据访问。与传统的 Text-to-SQL 方法相比,Analytic Agent 避免了直接操作原始数据库,而是通过 API 封装的业务逻辑来保证数据质量和安全性。

关键设计:Analytic Agent 的关键设计包括:1) 使用 Prompt Engineering 来引导 LLM 进行多步骤推理和 API 调用;2) 设计了权限验证机制,确保用户只能访问其有权访问的数据;3) 采用了 API 调用编排策略,确保 API 调用的顺序和参数正确。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

Analytic Agent 在 90 个真实企业用例中进行了评估,结果表明它能够可靠地解释用户目标、验证权限、执行受治理的查询,并生成符合规范的可视化结果。具体性能数据未知,但论文强调了其在企业级应用中的可靠性和安全性。

🎯 应用场景

Analytic Agent 可应用于各种企业级数据分析场景,例如销售数据分析、市场营销效果评估、客户行为分析等。它可以帮助非技术用户更方便地访问和分析企业数据,从而做出更明智的决策。未来,该技术可以扩展到更多领域,例如金融分析、医疗健康等,为各行各业提供更智能的数据分析服务。

📄 摘要(原文)

Enterprise analytics aims to make organizational data accessible for decision-making, yet non-technical users still face barriers when using traditional business intelligence tools or Text-to-SQL systems. While recent Text-to-SQL approaches based on Large Language Models (LLMs) promise natural language access to structured data, they fall short in enterprise settings where analytics pipelines rely on governed APIs rather than raw databases. In practice, these APIs encapsulate complex business logic to ensure consistency, auditability, and security. However, delegating mathematical or aggregation logic to an LLM introduces reliability and compliance risks. To this end, we present Analytic Agent, an LLM-based agentic system that translates natural language intents into secure interactions with enterprise analytics APIs. Evaluated on 90 real enterprise use cases constructed by domain experts, it reliably interprets user goals, validates permissions, executes governed queries, and generates compliant visualizations through multi-step reasoning and policy-aware orchestration.