Causal Ensemble Agent: Hierarchical Causal Discovery with LLM-guided Expert Reweighting

📄 arXiv: 2606.10607v1 📥 PDF

作者: Xinyu Li, Yuanyuan Wang, Haoxuan Li, Chuan Zhou, Erdun Gao, Bo Han, Tongliang Liu, Kun Zhang, Howard Bondell, Mingming Gong

分类: cs.LG, cs.AI, cs.CL

发布日期: 2026-06-09


💡 一句话要点

提出Causal Ensemble Agent以解决因果发现中的不一致性问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 因果发现 大型语言模型 专家系统 动态加权 统计学习

📋 核心要点

  1. 现有因果发现方法在结果上存在不一致性,导致准确识别因果图变得复杂。
  2. 提出Causal Ensemble Agent框架,通过聚合专家见解和LLM动态加权,提升因果图的构建质量。
  3. CEA在合成和真实数据集上的实验结果显示其在多种因果发现方法中表现最佳,验证了其有效性。

📝 摘要(中文)

因果发现旨在从观察数据中揭示因果结构,这对现实决策至关重要。然而,不同的因果发现算法可能产生相互矛盾的结果,增加了准确识别因果图的难度。传统方法依赖数值和统计假设,往往忽视丰富的领域特定信息。为了解决这些局限性,本文提出了Causal Ensemble Agent(CEA)框架,通过线性意见聚合不同图层的统计发现专家的结构性见解,并利用大型语言模型(LLM)作为元裁判,在聚合置信度接近决策边界时动态重新加权专家,从而构建更完整的因果图。大量实验表明,CEA在多种因果发现方法中表现出色,突显了LLM在因果发现中的元分析有效性。

🔬 方法详解

问题定义:本文旨在解决因果发现中不同算法结果不一致的问题,现有方法往往依赖于统计假设,忽视了领域特定信息的利用。

核心思路:Causal Ensemble Agent(CEA)通过线性意见聚合不同专家的见解,并利用大型语言模型(LLM)作为元裁判,动态调整专家权重,以提高因果图的准确性和完整性。

技术框架:CEA框架包括多个模块,首先通过统计方法获取不同专家的因果结构见解,然后使用LLM对这些见解进行动态加权,最后合成最终的因果图。

关键创新:CEA的创新在于引入LLM作为元裁判,能够在聚合置信度接近决策边界时调整专家权重,这一设计显著提升了因果图的构建质量。

关键设计:在模型设计中,采用线性意见聚合方法,设置了适当的阈值来判断聚合置信度,并通过实验验证了不同参数设置对最终结果的影响。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CEA在合成和真实数据集上的实验结果显示,其在多种因果发现方法中表现出色,尤其在聚合置信度接近决策边界时,动态加权机制显著提高了因果图的构建质量,整体性能提升幅度超过了现有基线方法。

🎯 应用场景

该研究的潜在应用领域包括医疗决策、经济模型构建和社会科学研究等。通过更准确的因果图构建,决策者可以在复杂环境中做出更为合理的决策,提升实际应用的有效性和可靠性。未来,CEA框架有望在更多领域推广应用,推动因果推断技术的发展。

📄 摘要(原文)

Causal discovery aims to uncover causal structures from observational data, which is crucial for real-world decision-making. However, different causal discovery algorithms can produce divergent results that conflict with each other, complicating the identification of accurate causal graphs. Traditional approaches rely on numerical values and statistical assumptions, often ignoring rich domain-specific information, such as feature descriptions, which could also help structure learning. While recent works explore using Large Language Models (LLMs) to infer causal relations via direct queries, such methods can be unreliable due to a lack of alignment with the actual data. To address these limitations, we propose Causal Ensemble Agent (CEA), a novel framework that aggregates structural insights from statistical discovery experts across different graph levels via linear opinion pooling, and uses an LLM as a meta-referee to dynamically reweight experts when the aggregated confidence is close to the decision boundary, thereby composing an improved and more complete causal graph. Extensive experiments on both synthetic and real-world datasets demonstrate that CEA achieves the strongest overall performance across a wide range of causal discovery methods, highlighting the effectiveness of using LLMs for meta-analysis in causal discovery.