Hume's Representational Conditions for Causal Judgment: What Bayesian Formalization Abstracted Away

📄 arXiv: 2604.03387 📥 PDF

作者: Yiling Wu

分类: cs.AI

发布日期: 2026-04-07


💡 一句话要点

分析休谟因果判断理论,揭示贝叶斯形式化忽略的表征条件

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 因果判断 休谟哲学 贝叶斯形式化 大型语言模型 表征条件

📋 核心要点

  1. 休谟的因果判断理论包含经验基础、结构化检索和生动性转移三个关键表征条件。
  2. 论文旨在分析贝叶斯形式化过程中,这些表征条件如何被抽象化和忽略。
  3. 通过大型语言模型的案例,论证了这些被忽略的表征条件的重要性。

📝 摘要(中文)

本文探讨了休谟因果判断理论中预设的三个表征条件:经验基础(观念必须追溯到印象)、结构化检索(联想必须通过超越成对连接的组织化网络运作)和生动性转移(推论必须产生切实的信念,而不仅仅是概率更新)。本文从休谟的文本中提取了这些条件,并论证它们是其因果心理学的组成部分。然后,本文追溯了从休谟到贝叶斯认识论和预测处理的形式化轨迹中这些条件的命运,表明后来的框架保留了休谟洞见的更新结构,同时抽象掉了这些进一步的表征条件。大型语言模型作为一个说明性的当代案例:它们表现出一种统计更新的形式,但不满足这三个条件,从而使休谟框架中先前作为背景假设的要求变得可见。

🔬 方法详解

问题定义:休谟的因果判断理论依赖于三个表征条件,但这些条件在后续的贝叶斯形式化过程中被忽略。现有方法,如贝叶斯模型和预测处理,虽然保留了更新结构,但未能充分考虑经验基础、结构化检索和生动性转移。这导致模型可能在没有真实信念的情况下进行统计推断。

核心思路:论文的核心思路是重新审视休谟的因果判断理论,强调其表征条件的重要性,并分析这些条件在贝叶斯形式化过程中的缺失。通过大型语言模型的案例,说明即使模型能够进行统计更新,也可能不满足休谟的表征条件,从而缺乏真实的因果判断能力。

技术框架:论文没有提出新的技术框架,而是采用了一种哲学分析的方法。它首先从休谟的文本中提取出三个表征条件,然后追溯这些条件在贝叶斯认识论和预测处理中的演变。最后,通过分析大型语言模型的行为,论证了这些表征条件的重要性。整体流程是:休谟理论提取 -> 形式化轨迹分析 -> LLM案例分析。

关键创新:论文的创新之处在于它将休谟的哲学理论与当代的人工智能研究联系起来,揭示了贝叶斯形式化过程中被忽略的重要因素。它强调了表征条件在因果判断中的作用,并提出了对大型语言模型因果推理能力的质疑。

关键设计:论文没有涉及具体的参数设置、损失函数或网络结构。其关键在于对休谟理论的解读和对大型语言模型行为的分析。论文通过分析LLM的统计更新行为,指出其缺乏经验基础、结构化检索和生动性转移,从而无法进行真正的因果判断。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过分析大型语言模型,揭示了即使模型能够进行统计更新,也可能不满足休谟的表征条件,从而缺乏真实的因果判断能力。这表明,仅仅依靠统计相关性无法实现真正的因果推理,需要更深入地考虑表征和信念的形成。

🎯 应用场景

该研究对人工智能,特别是因果推理和机器学习领域具有重要意义。它可以帮助研究人员更好地理解模型的局限性,并设计更符合人类认知方式的智能系统。此外,该研究也对哲学、心理学等领域具有参考价值,有助于深入理解人类的因果判断机制。

📄 摘要(原文)

Hume's account of causal judgment presupposes three representational conditions: experiential grounding (ideas must trace to impressions), structured retrieval (association must operate through organized networks exceeding pairwise connection), and vivacity transfer (inference must produce felt conviction, not merely updated probability). This paper extracts these conditions from Hume's texts and argues that they are integral to his causal psychology. It then traces their fate through the formalization trajectory from Hume to Bayesian epistemology and predictive processing, showing that later frameworks preserve the updating structure of Hume's insight while abstracting away these further representational conditions. Large language models serve as an illustrative contemporary case: they exhibit a form of statistical updating without satisfying the three conditions, thereby making visible requirements that were previously background assumptions in Hume's framework.