Quantum-Inspired Trace-Augmented Evidence Selection for Reasoning over Structured Hypothesis Spaces

📄 arXiv: 2606.06941v1 📥 PDF

作者: Laura Wynter, Nirvik Sahoo, Paul Griffin

分类: cs.AI

发布日期: 2026-06-05


💡 一句话要点

提出量子启发的证据选择方法以提升法律推理准确性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 法律推理 证据选择 组合优化 高阶优化 量子计算 推理链条 少数假设

📋 核心要点

  1. 现有方法在法律推理中面临证据质量不均和多数投票法的局限性,导致错误率较高。
  2. 本文提出EP-HUBO方法,将推理片段选择作为组合优化问题,允许少数正确假设优先于多数错误假设。
  3. 在法律推理基准上进行评估,EP-HUBO在低污染领域表现出色,提升了推理的准确性。

📝 摘要(中文)

大型语言模型(LLMs)在许多专家级考试中表现出色,但在法律等证据密集型领域仍显脆弱。错误不仅源于世界知识的缺口,还包括证据之间的细微差别和支持证据的不一致使用。常用的多数投票法未能有效考虑证据的质量。本文提出将推理片段的选择视为一个显式的组合优化问题,从而允许支持良好的少数假设覆盖噪声较大的多数假设,并在法律推理基准上进行评估。我们引入EP-HUBO(证据池高阶二元优化),生成多个推理链条,解析片段为每个假设的证据池,并使用质量导向的权重解决每个池的高阶无约束二元优化,最终将单一裁决调用委托给前沿模型。

🔬 方法详解

问题定义:本文旨在解决在法律推理中,现有方法因证据质量不均和多数投票法的局限性而导致的错误问题。现有方法未能有效考虑证据的强度和相关性。

核心思路:论文的核心思路是将推理片段的选择视为一个组合优化问题,允许支持良好的少数假设覆盖噪声较大的多数假设,从而提升推理的准确性。

技术框架:整体架构包括多个模块:首先,使用小型局部模型生成多个推理链条;其次,将推理片段解析为每个假设的证据池;然后,针对每个池进行高阶无约束二元优化,最后将裁决调用委托给前沿模型。

关键创新:最重要的技术创新在于引入EP-HUBO方法,通过高阶优化有效聚合推理片段,同时保留少数但正确的假设。这与传统的多数投票法本质上不同,后者未能考虑证据的质量。

关键设计:在设计中,采用质量导向的权重(相关性、特异性、独特性)来优化每个证据池,确保优化过程能够有效反映证据的真实价值。

📊 实验亮点

在两个证据密集型法律基准上评估EP-HUBO,结果显示该方法在低污染领域的推理准确性显著提升,尤其是在处理复杂证据时,相较于传统方法表现出更高的鲁棒性和准确性。

🎯 应用场景

该研究的潜在应用领域包括法律推理、合规审查和其他需要高质量证据支持的决策系统。通过提升推理的准确性,EP-HUBO方法能够为法律专业人士提供更可靠的支持,未来可能在智能法律助手和自动化法律分析中发挥重要作用。

📄 摘要(原文)

Large language models (LLMs) now solve a wide range of expert-level exams at or above human level, yet remain brittle on specialised, evidence-intensive domains such as law. On these tasks, errors arise not only from gaps in world knowledge but also from subtle distinctions between pieces of evidence and inconsistent use of supporting evidence. The most common aggregator over sampled chain-of-thought (CoT) traces, majority vote, returns the most popular answer regardless of whether its evidence is actually strongest. We propose to treat the selection of CoT reasoning fragments into a set of evidence as an explicit combinatorial optimisation problem, allowing well-supported but minority hypotheses to override noisy majorities, and to evaluate the approach on legal-reasoning benchmarks that are particularly sensitive to evidence quality. We introduce EP-HUBO (Evidence Pool Higher-Order Binary Optimisation), which generates multiple CoT traces with a small local model, parses fragments into per-hypothesis evidence pools, solves a higher-order unconstrained binary optimisation per pool with quality-derived weights (relevance, specificity, distinctiveness), and delegates a single adjudication call per question to a frontier model. We evaluate EP-HUBO on two evidence-intensive legal benchmarks using both simulated annealing on classical hardware and the Dirac-3 photonic entropy-quantum machine from Quantum Computing Inc. HUBO-style optimisation gives a principled way to aggregate reasoning fragments while preserving minority-but-correct hypotheses, and is most valuable in low-contamination domains where frontier models have not already absorbed the benchmark material.