Abductive Reasoning with Probabilistic Commonsense
作者: Joseph Cotnareanu, Chiara Roverato, Han Zhou, Didier Chetelat, Yingxue Zhang, Mark Coates
分类: cs.AI, stat.CO
发布日期: 2026-05-08
期刊: Proceedings of the International Conference on Machine Learning, 2026
💡 一句话要点
提出概率性溯因常识推理框架PACS,通过集成LLM与形式化求解器解决常识认知差异问题。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 溯因推理 神经符号学习 大语言模型 概率建模 常识推理 逻辑求解器
📋 核心要点
- 现有神经符号框架中的形式化求解器缺乏常识知识,且现有方法错误地假设常识事实在人群中具有普适性,忽略了认知差异。
- 提出PACS算法,通过LLM与形式化求解器交互采样证明过程,将个体常识差异建模为概率分布,并对推理结论进行聚合。
- 实验证明PACS在多个推理基准测试中表现优于思维链、传统神经符号及搜索类方法,显著提升了溯因推理的鲁棒性。
📝 摘要(中文)
近期提升大语言模型(LLM)推理能力的研究多集中于将形式逻辑求解器集成至神经符号框架中。然而,形式化求解器缺乏常识性世界知识,导致其无法完成人类认为显而易见的推理步骤。现有方法尝试利用LLM补充缺失的常识假设,但这些方法隐含地假设常识事实具有普适性,忽略了常识信念在个体间的差异。本文提出了一种概率性溯因常识推理框架,旨在显式建模这种差异,以判定多数人对陈述真伪的判断。我们引入了概率性溯因常识(PACS)算法,该算法利用LLM和形式化求解器对证明进行采样,将其视为个体不同常识信念的观测,并对这些样本的结论进行聚合。实验表明,PACS在多个基准测试中优于思维链(CoT)、现有神经符号方法及基于搜索的方法。
🔬 方法详解
问题定义:论文旨在解决溯因推理(Abductive Reasoning)中常识知识的获取与不确定性建模问题。现有方法将常识视为确定性事实,忽略了人类常识在不同个体间的异质性,导致推理结果在面对模糊场景时缺乏鲁棒性。
核心思路:将常识推理视为一个概率过程。通过将LLM生成的常识假设视为对潜在“世界观”的采样,利用形式化求解器验证这些假设下的逻辑一致性,从而通过聚合多个采样结果来估计结论的概率分布。
技术框架:PACS框架包含三个主要阶段:首先,利用LLM生成多种可能的常识假设;其次,将这些假设输入形式化求解器进行逻辑推演,生成多个候选证明路径;最后,通过聚合机制对不同路径的结论进行加权统计,得出最终的概率性判断。
关键创新:核心创新在于将“常识”从确定性知识转变为概率性分布。通过显式建模个体间的认知差异,PACS能够处理那些在人类社会中存在争议或不确定性的推理任务,克服了单一确定性假设的局限性。
关键设计:采用了基于采样的方法来模拟不同个体的常识信念,并引入了聚合函数来处理逻辑求解器的输出。具体参数设置包括采样规模(样本数量)以及用于评估逻辑一致性的形式化约束条件,确保了推理过程既符合逻辑严密性,又具备常识合理性。
🖼️ 关键图片
📊 实验亮点
PACS在多个溯因推理基准测试中展现了显著优势。实验结果显示,该方法在准确率上超越了传统的思维链(CoT)方法及现有的神经符号基线模型。特别是在处理涉及常识冲突的复杂逻辑任务时,PACS通过概率聚合机制,表现出比单一搜索策略更强的鲁棒性和更高的推理成功率。
🎯 应用场景
该研究在法律判决辅助、医疗诊断推理、复杂社会决策支持等领域具有重要价值。在这些场景中,常识往往存在主观性,PACS框架能够提供基于群体共识的概率性建议,帮助系统在面对模糊信息时做出更符合人类认知习惯的判断,提升人机协作的信任度。
📄 摘要(原文)
Recent efforts to improve the reasoning abilities of Large Language Models (LLMs) have focused on integrating formal logic solvers within neurosymbolic frameworks. A key challenge is that formal solvers lack commonsense world knowledge, preventing them from making reasoning steps that humans find obvious. Prior methods address this by using LLMs to supply missing commonsense assumptions, but these approaches implicitly assume universal agreement on such commonsense facts. In reality, commonsense beliefs vary across individuals. We propose a probabilistic framework for abductive commonsense reasoning that explicitly models this variation, aiming to determine whether most people would judge a statement as true or false. We introduce Probabilistic Abductive CommonSense (PACS), a novel algorithm that uses an LLM and a formal solver to sample proofs as observations of individuals' distinct commonsense beliefs, and aggregates conclusions across these samples. Empirically, PACS outperforms chain-of-thought reasoning, prior neurosymbolic methods, and search-based approaches across multiple benchmarks.