BoolXLLM: LLM-Assisted Explainability for Boolean Models

📄 arXiv: 2605.12139v1 📥 PDF

作者: Du Cheng, Serdar Kadioglu, Xin Wang

分类: cs.AI

发布日期: 2026-05-12


💡 一句话要点

BoolXLLM:提出一种LLM辅助的布尔模型可解释性框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 可解释机器学习 布尔模型 大型语言模型 特征选择 规则解释

📋 核心要点

  1. 现有布尔模型可解释性方法在特征选择和规则翻译方面存在挑战,非技术人员难以理解。
  2. BoolXLLM利用LLM在特征选择、阈值推荐和规则解释三个阶段增强布尔规则学习流程。
  3. 实验结果表明,LLM辅助的流程在保持预测性能的同时,显著提高了模型的可解释性。

📝 摘要(中文)

可解释机器学习旨在提供透明的模型,使人类能够轻松理解其决策过程。近年来,基于规则的方法(如可表达的布尔公式BoolXAI)为模型行为提供了忠实且紧凑的表示。然而,对于非技术利益相关者来说,实践中仍然存在主要挑战:(i) 选择语义上有意义的特征;(ii) 将形式逻辑规则转化为易于理解的解释。本文提出了BoolXLLM,这是一个混合框架,将大型语言模型(LLM)集成到布尔规则学习的端到端流程中。我们使用LLM在三个关键阶段增强了可表达的基于布尔规则的分类器BoolXAI:(1) 特征选择,LLM指导识别领域相关的变量;(2) 阈值推荐,LLM为数值特征提出语义上有意义的离散化策略;(3) 规则压缩和解释,布尔规则被翻译成全局和局部层面的自然语言解释。这种集成将形式化的、忠实的解释与人类可理解的叙述联系起来,从而构建了一个在理论上扎实且非专家可访问的可解释AI系统。初步的实验结果表明,LLM辅助的流程在保持竞争性预测性能的同时,提高了可解释性。我们的工作突出了将符号推理与基于语言的模型相结合以实现以人为中心的可解释性的前景。

🔬 方法详解

问题定义:论文旨在解决布尔模型可解释性问题,特别是如何让非技术人员更容易理解布尔模型的决策过程。现有方法,如BoolXAI,虽然提供了忠实且紧凑的规则表示,但在特征选择和将形式逻辑规则转化为自然语言解释方面存在不足,导致非技术人员难以理解模型的行为。

核心思路:论文的核心思路是利用大型语言模型(LLM)的自然语言理解和生成能力,辅助布尔规则学习的各个阶段,从而弥合形式化规则和人类可理解的解释之间的差距。通过LLM,可以更好地选择语义上有意义的特征,推荐合适的数值特征离散化策略,并将复杂的布尔规则转化为简洁明了的自然语言描述。

技术框架:BoolXLLM框架主要包含三个阶段:1) LLM辅助的特征选择:利用LLM识别与领域相关的变量,减少人工干预,提高特征选择的效率和质量。2) LLM辅助的阈值推荐:针对数值特征,LLM提出语义上有意义的离散化策略,将连续值转化为离散的布尔变量。3) LLM辅助的规则压缩和解释:利用LLM将学习到的布尔规则转化为自然语言解释,包括全局解释和局部解释,使非技术人员能够理解模型的整体行为和特定决策的原因。

关键创新:该论文的关键创新在于将LLM集成到布尔规则学习的端到端流程中,利用LLM的自然语言能力增强了布尔模型的可解释性。与传统的布尔模型可解释性方法相比,BoolXLLM能够自动选择语义上有意义的特征,推荐合适的离散化策略,并将复杂的布尔规则转化为易于理解的自然语言解释,从而显著提高了模型的可理解性。

关键设计:具体的技术细节包括:如何设计LLM的prompt,使其能够有效地进行特征选择、阈值推荐和规则解释;如何将LLM的输出集成到BoolXAI的训练过程中;如何评估LLM生成的解释的质量;以及如何平衡模型的可解释性和预测性能。论文可能使用了特定的LLM,并针对特定任务进行了微调。具体的损失函数和网络结构等细节未知。

🖼️ 关键图片

fig_0

📊 实验亮点

论文的实验结果表明,LLM辅助的流程在保持竞争性预测性能的同时,显著提高了模型的可解释性。具体的性能数据和对比基线未知,但论文强调了LLM在特征选择、阈值推荐和规则解释方面的有效性,以及最终可解释性的提升。

🎯 应用场景

BoolXLLM可应用于医疗诊断、金融风控、法律咨询等需要高度可解释性的领域。它可以帮助领域专家理解模型的决策依据,从而提高模型的信任度和可接受度。此外,BoolXLLM还可以用于模型调试和优化,帮助开发人员发现模型中的潜在问题,并改进模型的性能。未来,该方法有望推广到其他类型的可解释机器学习模型中。

📄 摘要(原文)

Interpretable machine learning aims to provide transparent models whose decision-making processes can be readily understood by humans. Recent advances in rule-based approaches, such as expressive Boolean formulas (BoolXAI), offer faithful and compact representations of model behavior. However, for non-technical stakeholders, main challenges remain in practice: (i) selecting semantically meaningful features and (ii) translating formal logical rules into accessible explanations. In this work, we propose BoolXLLM , as a hybrid framework that integrates Large Language Models (LLMs) into the end-to-end pipeline of Boolean rule learning. We augment BoolXAI , an expressive Boolean rule-based classifier, with LLMs at three critical stages: (1) feature selection, where LLMs guide the identification of domain-relevant variables; (2) threshold recommendation, where LLMs propose semantically meaningful discretization strategies for numerical features; and (3) rule compression and interpretation, where Boolean rules are translated into natural language explanations at both global and local levels. This integration bridges formal, faithful explanations with human-understandable narratives. This allows build an explainable AI system that is both theoretically grounded and accessible to non-experts. Early empirical results demonstrate that LLM-assisted pipelines improve interpretability while maintaining competitive predictive performance. Our work highlights the promise of combining symbolic reasoning with language-based models for human-centered explainability.