NyayaAI: An AI-Powered Legal Assistant Using Multi-Agent Architecture and Retrieval-Augmented Generation

📄 arXiv: 2605.10155v1 📥 PDF

作者: Deepanshu, Divi Saxena, Deepali Rana, Ayesha Varshney, Sahinur Rahman Laskar

分类: cs.CL

发布日期: 2026-05-11

备注: 3 pages, 1 figure

🔗 代码/项目: GITHUB


💡 一句话要点

提出NyayaAI多智能体法律助手,通过RAG架构提升印度法律文档的检索与分析效率

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 检索增强生成 法律人工智能 大语言模型 法律科技 知识库构建

📋 核心要点

  1. 法律语言高度专业化且文档体量庞大,导致印度法律信息检索与分析的门槛极高,现有工具难以满足高效处理需求。
  2. 提出基于Mastra框架的多智能体架构,集成RAG技术,通过分工明确的子智能体处理法律研究、摘要、检索及起草任务。
  3. 实验结果显示,该系统在领域分类、检索精度及响应准确率上分别达到70%、74%和72%,有效提升了法律工作流的自动化水平。

📝 摘要(中文)

由于法律语言的复杂性及海量文档的存在,印度法律信息获取难度极大。本文提出了NyayaAI,这是一个基于人工智能的法律助手,旨在为律师、法学学生及普通用户简化法律工作流程。该系统将大语言模型(LLM)与检索增强生成(RAG)流水线相结合,并基于包含宪法条款、法规、判例法及司法先例的印度法律知识库进行构建。系统采用由Mastra TypeScript框架编排的多智能体架构,协调主智能体与负责法律研究、文档摘要、判例检索及文书起草的子智能体。此外,系统内置合规模块以验证输出。实验表明,该系统在领域分类、RAG检索及响应准确率上分别达到70%、74%和72%,证明了结构化多智能体LLM系统在提升法律可及性方面的有效性。

🔬 方法详解

问题定义:论文旨在解决印度法律领域中因术语晦涩、文档冗杂导致的信息获取困难问题,旨在降低法律研究与文档处理的门槛,提升法律专业人士的工作效率。

核心思路:采用多智能体协作(Multi-Agent Collaboration)与RAG相结合的范式。通过将复杂的法律任务拆解为多个子任务,由专业智能体协同完成,确保生成内容既具备LLM的生成能力,又具备法律知识库的严谨性。

技术框架:系统基于Mastra TypeScript框架构建,包含一个主智能体(Main Agent)负责任务调度,以及多个子智能体(Sub-agents)分别处理法律研究、文档摘要、判例检索和文书起草。系统末端集成合规性验证模块(Compliance Module)对生成结果进行过滤。

关键创新:引入了结构化的多智能体编排机制,而非单一的LLM调用。这种设计允许系统在处理特定法律任务时调用专门的知识库子集,显著降低了幻觉风险,并增强了法律逻辑的连贯性。

关键设计:系统构建了针对印度法律的专用知识库,涵盖宪法、法规及判例。在检索阶段,通过RAG流水线将用户查询与知识库进行语义匹配,并利用合规模块作为“守门人”,确保输出符合法律规范与伦理要求。

🖼️ 关键图片

fig_0

📊 实验亮点

实验评估显示,NyayaAI在法律领域分类任务中实现了70%的精确度,RAG检索精度达到74%,整体响应准确率达到72%。这些指标验证了多智能体架构在处理复杂法律语境下的鲁棒性,证明了该系统在自动化法律工作流中的实际应用潜力。

🎯 应用场景

NyayaAI可广泛应用于律师事务所的案件预研、法学院的教学辅助以及普通民众的法律咨询。其自动化起草与判例检索功能能够显著缩短法律文书准备时间,降低法律服务成本,对提升司法透明度与法律知识的普及具有深远影响。

📄 摘要(原文)

Legal information in India remains largely inaccessible due to the complexity of legal language and the sheer volume of legal documentation involved in research and case analysis. This paper presents NyayaAI, an AI-powered legal assistant that automates and simplifies legal workflows for lawyers, law students, and general users. The system combines Large Language Models with a Retrieval-Augmented Generation pipeline grounded in a curated Indian legal knowledge base comprising constitutional provisions, statutes, case laws, and judicial precedents. A multi-agent architecture orchestrated through the Mastra TypeScript framework coordinates a main agent with specialized sub-agents handling legal research, document summarization, case law retrieval, and drafting assistance. A compliance module validates all responses before delivery. Domain classification achieved 70\% precision across test samples, with RAG retrieval precision at 74\% and overall response accuracy at 72\%, demonstrating that structured multi-agent LLM systems can meaningfully improve legal accessibility and workflow efficiency. The code\footnote{https://github.com/B97784/NyayaAI} is made publicly available for the benefit of the research community.