$\textit{Grahak-Nyay:}$ Consumer Grievance Redressal through Large Language Models

📄 arXiv: 2507.04854v1 📥 PDF

作者: Shrey Ganatra, Swapnil Bhattacharyya, Harshvivek Kashid, Spandan Anaokar, Shruti Nair, Reshma Sekhar, Siddharth Manohar, Rahul Hemrajani, Pushpak Bhattacharyya

分类: cs.CL

发布日期: 2025-07-07


💡 一句话要点

Grahak-Nyay:利用大型语言模型解决印度消费者权益纠纷问题。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 消费者权益保护 大型语言模型 检索增强生成 聊天机器人 法律AI

📋 核心要点

  1. 印度消费者权益保护面临程序复杂、法律术语晦涩和管辖权挑战等问题,阻碍了消费者有效维权。
  2. Grahak-Nyay利用开源LLM和RAG技术,构建一个聊天机器人,通过简化法律知识和提供相关判例,辅助消费者解决纠纷。
  3. 论文构建了多个QA数据集和对话数据集,并提出HAB指标评估聊天机器人性能,法律专家验证了系统的有效性。

📝 摘要(中文)

本文提出Grahak-Nyay(消费者正义),一个利用开源大型语言模型(LLM)和检索增强生成(RAG)的聊天机器人,旨在简化印度消费者权益纠纷处理流程,解决程序复杂、法律术语晦涩和管辖权挑战等问题。Grahak-Nyay通过简洁且最新的知识库简化法律复杂性。论文贡献了三个新的数据集:GeneralQA(通用消费者法)、SectoralQA(特定行业知识)和SyntheticQA(用于RAG评估),以及包含300个带注释的聊天机器人对话的NyayChat数据集。此外,还引入了来自印度消费者法院的Judgments数据,以辅助聊天机器人进行决策并增强用户信任。论文还提出了HAB指标(Helpfulness, Accuracy, Brevity,即有用性、准确性和简洁性)来评估聊天机器人的性能。法律领域专家验证了Grahak-Nyay的有效性。代码和数据集将会开源。

🔬 方法详解

问题定义:印度消费者权益纠纷处理流程复杂,法律术语晦涩难懂,消费者难以有效维护自身权益。现有方法缺乏针对性和易用性,无法有效解决消费者面临的实际问题。

核心思路:利用大型语言模型(LLM)的理解和生成能力,结合检索增强生成(RAG)技术,构建一个智能聊天机器人,为消费者提供简洁、准确、易懂的法律咨询和纠纷解决建议。通过检索相关法律条文和判例,为LLM提供外部知识,提高回答的准确性和可靠性。

技术框架:Grahak-Nyay系统主要包含以下模块:1) 知识库构建模块,收集和整理消费者法律相关知识,包括法律条文、行业法规、判例等;2) RAG模块,根据用户提问,从知识库中检索相关信息,并将其作为上下文输入LLM;3) LLM生成模块,利用LLM生成简洁、准确、易懂的回答;4) 用户交互模块,提供友好的用户界面,方便用户提问和获取答案。

关键创新:1) 构建了多个高质量的QA数据集和对话数据集,用于训练和评估聊天机器人;2) 提出了HAB指标,用于综合评估聊天机器人的有用性、准确性和简洁性;3) 引入了印度消费者法院的判例数据,增强了聊天机器人的决策能力和用户信任度。

关键设计:论文使用了开源LLM作为基础模型,并针对消费者法律领域进行了微调。RAG模块使用了基于向量相似度的检索方法,选择与用户提问最相关的知识片段。HAB指标的计算方法未知,论文未提供具体细节。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文构建了三个新的QA数据集(GeneralQA, SectoralQA, SyntheticQA)和一个对话数据集(NyayChat),为该领域的研究提供了宝贵资源。提出的HAB指标为评估聊天机器人在法律领域的性能提供了一种新的方法。法律领域专家验证了Grahak-Nyay的有效性,但具体的性能数据和提升幅度未知。

🎯 应用场景

Grahak-Nyay可应用于在线法律咨询、消费者权益保护热线、政府监管部门等场景,帮助消费者快速了解相关法律知识,解决纠纷,提高维权效率。该研究有助于推动法律服务的普及化和智能化,促进社会公平正义,并为其他领域的法律AI应用提供借鉴。

📄 摘要(原文)

Access to consumer grievance redressal in India is often hindered by procedural complexity, legal jargon, and jurisdictional challenges. To address this, we present $\textbf{Grahak-Nyay}$ (Justice-to-Consumers), a chatbot that streamlines the process using open-source Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG). Grahak-Nyay simplifies legal complexities through a concise and up-to-date knowledge base. We introduce three novel datasets: $\textit{GeneralQA}$ (general consumer law), $\textit{SectoralQA}$ (sector-specific knowledge) and $\textit{SyntheticQA}$ (for RAG evaluation), along with $\textit{NyayChat}$, a dataset of 300 annotated chatbot conversations. We also introduce $\textit{Judgments}$ data sourced from Indian Consumer Courts to aid the chatbot in decision making and to enhance user trust. We also propose $\textbf{HAB}$ metrics ($\textbf{Helpfulness, Accuracy, Brevity}$) to evaluate chatbot performance. Legal domain experts validated Grahak-Nyay's effectiveness. Code and datasets will be released.