Universal Legal Article Prediction via Tight Collaboration between Supervised Classification Model and LLM

📄 arXiv: 2509.22119v1 📥 PDF

作者: Xiao Chi, Wenlin Zhong, Yiquan Wu, Wei Wang, Kun Kuang, Fei Wu, Minghui Xiong

分类: cs.CL, cs.AI

发布日期: 2025-09-26

备注: 10 pages, 6 figures, Accepted to ICAIL 2025 (International Conference on Artificial Intelligence and Law)

DOI: 10.1145/3769126.3769221


💡 一句话要点

提出Uni-LAP框架,通过监督分类模型与LLM紧密协作,实现通用法律条文预测。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 法律条文预测 自然语言处理 监督分类模型 大型语言模型 三段论推理 法律人工智能 文本分类

📋 核心要点

  1. 现有监督分类模型难以捕捉复杂案件事实,大型语言模型在法律条文预测中表现不佳,且缺乏跨司法管辖区的通用性。
  2. Uni-LAP框架通过监督分类模型生成候选条文,并利用大型语言模型进行三段论推理,从而实现更准确的预测。
  3. 实验结果表明,Uni-LAP在多个司法管辖区的数据集上均优于现有基线,证明了其有效性和泛化能力。

📝 摘要(中文)

法律条文预测(LAP)是法律文本分类中的关键任务,它利用自然语言处理(NLP)技术,根据案件的事实描述自动预测相关的法律条文。作为法律决策的基础步骤,LAP在确定后续判决(如指控和处罚)方面起着关键作用。然而,现有方法在解决LAP的复杂性方面面临重大挑战。监督分类模型(SCM),如CNN和BERT,由于其固有的局限性,难以充分捕捉复杂的案件事实模式。另一方面,大型语言模型(LLM)虽然擅长生成任务,但在预测场景中的表现欠佳,这是由于法律条文的抽象性和基于ID的性质所致。此外,不同司法管辖区法律体系的多样性加剧了这个问题,因为大多数方法都是针对特定国家/地区量身定制的,缺乏更广泛的适用性。为了解决这些局限性,我们提出了Uni-LAP,一个通用的法律条文预测框架,通过紧密协作整合了SCM和LLM的优势。具体来说,在Uni-LAP中,SCM通过一种新颖的Top-K损失函数得到增强,以生成准确的候选条文,而LLM则采用受三段论启发的推理来优化最终预测。我们在来自多个司法管辖区的数据集上评估了Uni-LAP,实验结果表明,我们的方法始终优于现有的基线,展示了其有效性和泛化能力。

🔬 方法详解

问题定义:论文旨在解决法律条文预测(LAP)任务中,现有方法难以兼顾准确性和通用性的问题。监督分类模型(SCM)无法充分理解复杂案件事实,而大型语言模型(LLM)在预测任务中表现不佳。此外,现有方法通常针对特定司法管辖区定制,缺乏跨区域的泛化能力。

核心思路:Uni-LAP的核心思路是结合SCM和LLM的优势,通过紧密协作实现更准确和通用的法律条文预测。SCM负责生成候选条文,利用其在分类任务上的优势;LLM则负责对候选条文进行推理和优化,利用其在自然语言理解和推理方面的能力。

技术框架:Uni-LAP框架包含两个主要模块:增强的监督分类模型(SCM)和基于三段论推理的大型语言模型(LLM)。首先,SCM接收案件的事实描述作为输入,并使用Top-K损失函数生成Top-K个候选法律条文。然后,LLM接收案件描述和候选条文,并使用三段论推理来判断每个候选条文的合理性,最终输出预测结果。

关键创新:Uni-LAP的关键创新在于将SCM和LLM紧密结合,利用各自的优势互补。此外,Top-K损失函数的设计使得SCM能够生成更准确的候选条文,而三段论推理则提高了LLM的推理能力。这种协作方式克服了现有方法的局限性,实现了更准确和通用的法律条文预测。

关键设计:Top-K损失函数旨在使SCM能够预测Top-K个最相关的法律条文,而不仅仅是单个最相关的条文。三段论推理模块利用LLM的自然语言理解能力,将案件描述和候选条文转化为三段论的形式,然后判断推理的有效性。具体参数设置和网络结构细节在论文中未详细说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

Uni-LAP在多个司法管辖区的数据集上进行了评估,实验结果表明,该方法始终优于现有的基线方法。具体的性能数据和提升幅度在摘要中未给出,属于未知信息。但结论表明Uni-LAP具有良好的有效性和泛化能力。

🎯 应用场景

Uni-LAP可应用于智能法律咨询、辅助判决、法律知识图谱构建等领域。通过自动预测相关法律条文,可以提高法律从业人员的工作效率,降低法律服务的成本,并为公众提供更便捷的法律信息服务。该研究的成果有助于推动法律人工智能的发展,并促进法律行业的智能化转型。

📄 摘要(原文)

Legal Article Prediction (LAP) is a critical task in legal text classification, leveraging natural language processing (NLP) techniques to automatically predict relevant legal articles based on the fact descriptions of cases. As a foundational step in legal decision-making, LAP plays a pivotal role in determining subsequent judgments, such as charges and penalties. Despite its importance, existing methods face significant challenges in addressing the complexities of LAP. Supervised classification models (SCMs), such as CNN and BERT, struggle to fully capture intricate fact patterns due to their inherent limitations. Conversely, large language models (LLMs), while excelling in generative tasks, perform suboptimally in predictive scenarios due to the abstract and ID-based nature of legal articles. Furthermore, the diversity of legal systems across jurisdictions exacerbates the issue, as most approaches are tailored to specific countries and lack broader applicability. To address these limitations, we propose Uni-LAP, a universal framework for legal article prediction that integrates the strengths of SCMs and LLMs through tight collaboration. Specifically, in Uni-LAP, the SCM is enhanced with a novel Top-K loss function to generate accurate candidate articles, while the LLM employs syllogism-inspired reasoning to refine the final predictions. We evaluated Uni-LAP on datasets from multiple jurisdictions, and empirical results demonstrate that our approach consistently outperforms existing baselines, showcasing its effectiveness and generalizability.