eSapiens: A Platform for Secure and Auditable Retrieval-Augmented Generation
作者: Isaac Shi, Zeyuan Li, Fan Liu, Wenli Wang, Lewei He, Yang Yang, Tianyu Shi
分类: cs.AI
发布日期: 2025-07-13
💡 一句话要点
eSapiens:一个安全可审计的检索增强生成平台,赋能企业AI应用。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: AI即服务 检索增强生成 数据安全 知识保留 LangChain SQL查询 企业应用
📋 核心要点
- 现有AI解决方案在企业应用中面临数据安全、知识保留和工作流集成等挑战,阻碍了AI的广泛应用。
- eSapiens平台通过构建企业内部的AI即服务平台,实现对AI资产的完全控制,保障数据安全和知识积累。
- 实验表明,eSapiens在法律语料库检索中Top-3准确率达到91.3%,并在生成质量上提升高达23%。
📝 摘要(中文)
eSapiens是一个AI即服务(AIaaS)平台,专为商业需求设计,围绕专有数据、运营工作流和主流大语言模型(LLM)构建。eSapiens使企业能够完全掌控其AI资产,将所有内容保留在内部,以实现AI知识保留和数据安全。eSapiens AI Agents (Sapiens)通过提供有价值的见解和自动化重复性任务来增强团队能力,使他们能够专注于高影响力工作并推动更好的业务成果。该系统集成了结构化文档摄取、混合向量检索和通过LangChain实现的无代码编排,并支持包括OpenAI、Claude、Gemini和DeepSeek在内的顶级LLM。一个关键组件是THOR Agent,它处理结构化的SQL风格查询,并生成关于企业数据库的可操作见解。评估结果表明,eSapiens在法律和金融等高风险领域实现可信、可审计的AI工作流方面非常有效。
🔬 方法详解
问题定义:现有方法在企业应用中,难以保证数据安全和知识产权,同时缺乏对企业内部工作流的有效集成。企业需要一个能够安全、可审计地利用自身数据和现有LLM的AI平台。
核心思路:eSapiens的核心思路是构建一个企业内部的AI即服务(AIaaS)平台,将专有数据、运营工作流和主流LLM集成在一起,使企业能够完全掌控其AI资产。通过这种方式,企业可以确保数据安全,保留AI知识,并将其AI能力无缝集成到现有工作流程中。
技术框架:eSapiens平台包含以下主要模块:1) 结构化文档摄取模块,用于将企业内部的各种文档转换为可处理的格式;2) 混合向量检索模块,用于高效地检索相关信息;3) 无代码编排模块(基于LangChain),用于灵活地定义和管理AI工作流;4) THOR Agent,用于处理SQL查询并生成可操作的见解。该平台支持多种主流LLM,如OpenAI、Claude、Gemini和DeepSeek。
关键创新:eSapiens的关键创新在于其整体架构设计,它将数据安全、知识保留和工作流集成作为核心目标,并提供了一个易于使用和定制的AI平台。THOR Agent是另一个创新点,它允许用户通过SQL查询与企业数据库进行交互,从而生成更具针对性的见解。
关键设计:在检索模块中,论文实验表明,chunk size设置为512 tokens时,检索精度最高。THOR Agent的设计需要仔细考虑SQL查询的解析和执行,以及如何将查询结果转换为LLM可以理解的格式。在生成质量评估中,使用了TRACe指标来衡量生成结果的上下文一致性和事实对齐。
🖼️ 关键图片
📊 实验亮点
在法律语料库上的检索实验表明,chunk size为512 tokens时,eSapiens的Top-3检索准确率达到91.3%。在生成质量测试中,使用TRACe指标评估了五个LLM,结果表明eSapiens能够提供更符合上下文的输出,并在事实对齐方面提升高达23%。
🎯 应用场景
eSapiens平台可广泛应用于法律、金融、医疗等高风险领域,帮助企业自动化重复性任务,提供有价值的见解,并提高决策效率。通过保障数据安全和知识产权,eSapiens能够促进企业AI应用的普及,并推动业务创新。
📄 摘要(原文)
We present eSapiens, an AI-as-a-Service (AIaaS) platform engineered around a business-oriented trifecta: proprietary data, operational workflows, and any major agnostic Large Language Model (LLM). eSapiens gives businesses full control over their AI assets, keeping everything in-house for AI knowledge retention and data security. eSapiens AI Agents (Sapiens) empower your team by providing valuable insights and automating repetitive tasks, enabling them to focus on high-impact work and drive better business outcomes. The system integrates structured document ingestion, hybrid vector retrieval, and no-code orchestration via LangChain, and supports top LLMs including OpenAI, Claude, Gemini, and DeepSeek. A key component is the THOR Agent, which handles structured SQL-style queries and generates actionable insights over enterprise databases. To evaluate the system, we conduct two experiments. First, a retrieval benchmark on legal corpora reveals that a chunk size of 512 tokens yields the highest retrieval precision (Top-3 accuracy: 91.3%). Second, a generation quality test using TRACe metrics across five LLMs shows that eSapiens delivers more context-consistent outputs with up to a 23% improvement in factual alignment. These results demonstrate the effectiveness of eSapiens in enabling trustworthy, auditable AI workflows for high-stakes domains like legal and finance.