Multimodal Multi-Agent Empowered Legal Judgment Prediction

作者: Zhaolu Kang, Junhao Gong, Qingxi Chen, Hao Zhang, Jiaxin Liu, Rong Fu, Zhiyuan Feng, Yuan Wang, Simon Fong, Kaiyue Zhou

分类: cs.CL

发布日期: 2026-01-19 (更新: 2026-01-21)

备注: Accepted to the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2026

💡 一句话要点

提出JurisMMA框架，通过多智能体协作解决法律判决预测中的多模态复杂推理问题

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 法律判决预测 多智能体系统 多模态学习 视频文本分析 法律人工智能

📋 核心要点

传统法律判决预测方法难以处理多重指控和证据，缺乏对复杂案件的适应性。
JurisMMA框架通过分解审判任务、标准化流程，并采用多智能体协作来解决上述问题。
JurisMM数据集包含文本和视频-文本数据，实验结果验证了JurisMMA框架的有效性。

📝 摘要（中文）

法律判决预测（LJP）旨在根据案件事实描述预测法律案件的结果，是推进法律系统发展的一项基础任务。传统方法通常依赖于统计分析或基于角色的模拟，但在处理多重指控、多样化证据和缺乏适应性方面面临挑战。本文提出了JurisMMA，一种新颖的LJP框架，它有效地分解审判任务，标准化流程，并将它们组织成不同的阶段。此外，我们构建了JurisMM，一个包含超过10万条最新中国司法记录的大型数据集，包括文本和多模态视频-文本数据，从而实现全面的评估。在JurisMM和基准LawBench上的实验验证了我们框架的有效性。这些结果表明，我们的框架不仅对LJP有效，而且对更广泛的法律应用也有效，为未来法律方法和数据集的开发提供了新的视角。

🔬 方法详解

问题定义：法律判决预测（LJP）旨在根据案件事实描述预测案件结果。现有方法，如统计分析和基于角色的模拟，在处理复杂案件时表现不佳，尤其是在面对多重指控、多样化证据以及需要高度适应性的场景时，推理能力不足。

核心思路：JurisMMA的核心思路是将复杂的法律审判过程分解为多个可管理的阶段，并为每个阶段配备专门的智能体。通过智能体之间的协作，模拟律师、法官等不同角色的行为，从而实现更准确的判决预测。这种分解和协作的设计旨在提高模型对复杂案件的理解和推理能力。

技术框架：JurisMMA框架包含多个阶段，每个阶段由一个或多个智能体负责。这些阶段可能包括证据收集、事实认定、法律适用和判决生成等。每个智能体接收来自前一阶段的信息，并根据自身角色执行相应的任务。智能体之间通过消息传递进行协作，最终生成判决结果。整体流程模拟了真实的法律审判过程。

关键创新：JurisMMA的关键创新在于其多智能体架构，它允许模型以更模块化和可解释的方式处理复杂的法律案件。与传统的单体模型相比，JurisMMA能够更好地模拟法律推理过程，并利用不同智能体的专业知识来提高预测准确性。此外，JurisMM数据集的构建也为多模态法律判决预测提供了新的资源。

关键设计：具体的智能体实现细节未知，但可以推测每个智能体可能采用不同的神经网络结构，例如Transformer或图神经网络，以处理文本和视频数据。损失函数的设计可能包括判决结果的交叉熵损失，以及智能体之间协作的奖励机制。参数设置方面，可能需要根据不同智能体的任务进行调整，以优化整体性能。

🖼️ 关键图片

📊 实验亮点

论文在JurisMM数据集和LawBench基准上进行了实验，验证了JurisMMA框架的有效性。具体性能数据未知，但摘要表明JurisMMA在LJP任务上取得了显著的成果，并且对更广泛的法律应用也有效。与现有方法相比，JurisMMA能够更好地处理复杂案件，并提供更准确的判决预测。

🎯 应用场景

JurisMMA框架可应用于智能法律咨询、辅助判决、法律教育等领域。通过分析案件事实和法律条文，为律师和法官提供参考意见，提高法律工作的效率和准确性。此外，该框架还可以用于法律知识普及，帮助公众更好地理解法律。

📄 摘要（原文）

Legal Judgment Prediction (LJP) aims to predict the outcomes of legal cases based on factual descriptions, serving as a fundamental task to advance the development of legal systems. Traditional methods often rely on statistical analyses or role-based simulations but face challenges with multiple allegations, diverse evidence, and lack adaptability. In this paper, we introduce JurisMMA, a novel framework for LJP that effectively decomposes trial tasks, standardizes processes, and organizes them into distinct stages. Furthermore, we build JurisMM, a large dataset with over 100,000 recent Chinese judicial records, including both text and multimodal video-text data, enabling comprehensive evaluation. Experiments on JurisMM and the benchmark LawBench validate our framework's effectiveness. These results indicate that our framework is effective not only for LJP but also for a broader range of legal applications, offering new perspectives for the development of future legal methods and datasets.

Multimodal Multi-Agent Empowered Legal Judgment Prediction

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理