EmeraldMind: A Knowledge Graph-Augmented Framework for Greenwashing Detection
作者: Georgios Kaoukis, Ioannis Aris Koufopoulos, Eleni Psaroudaki, Danae Pla Karidi, Evaggelia Pitoura, George Papastefanatos, Panayiotis Tsaparas
分类: cs.AI
发布日期: 2025-12-12 (更新: 2025-12-15)
💡 一句话要点
提出EmeraldMind框架,利用知识图谱增强的检索增强生成技术,用于检测企业漂绿行为。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 漂绿检测 知识图谱 检索增强生成 ESG报告 大型语言模型
📋 核心要点
- 现有方法在检测漂绿行为时,缺乏对企业ESG报告等领域特定知识的有效利用,导致准确率和覆盖率不足。
- EmeraldMind框架构建领域知识图谱EmeraldGraph,结合检索增强生成技术,为大型语言模型提供可验证的证据,辅助其进行漂绿检测。
- 实验结果表明,EmeraldMind在漂绿检测任务上取得了具有竞争力的准确率,更大的覆盖范围和更好的可解释性,且无需微调。
📝 摘要(中文)
随着人工智能和网络代理在决策中日益普及,设计智能系统不仅支持可持续发展,还要防范虚假信息至关重要。漂绿,即具有误导性的企业可持续发展声明,对环境进步构成重大挑战。为了应对这一挑战,我们提出了EmeraldMind,这是一个以事实为中心的框架,它将特定领域的知识图谱与检索增强生成相结合,以自动检测漂绿行为。EmeraldMind从各种企业ESG(环境、社会和治理)报告中构建EmeraldGraph,挖掘通用知识库中通常缺失的可验证证据,并支持大型语言模型进行声明评估。该框架提供以理由为中心的分类,呈现透明、有证据支持的结论,并在无法验证声明时负责任地弃权。在新漂绿声明数据集上的实验表明,与通用LLM相比,EmeraldMind实现了具有竞争力的准确性、更大的覆盖范围和卓越的解释质量,而无需进行微调或重新训练。
🔬 方法详解
问题定义:论文旨在解决企业“漂绿”行为的自动检测问题。现有方法,特别是通用的大型语言模型,在缺乏特定领域知识的情况下,难以准确判断企业可持续发展声明的真伪。它们无法有效利用企业ESG报告等信息源,导致检测结果的准确性和可信度受到限制。
核心思路:论文的核心思路是构建一个领域知识图谱(EmeraldGraph),并将其与检索增强生成(Retrieval-Augmented Generation, RAG)技术相结合。通过知识图谱提供结构化的、可验证的企业ESG信息,RAG技术能够将这些信息检索出来,并作为上下文提供给大型语言模型,从而提高其判断漂绿行为的准确性和可解释性。
技术框架:EmeraldMind框架主要包含以下几个模块:1) EmeraldGraph构建模块:从各种企业ESG报告中提取实体和关系,构建领域知识图谱。2) 检索模块:根据输入的企业声明,从EmeraldGraph中检索相关的证据。3) 生成模块:利用大型语言模型,结合检索到的证据,生成对企业声明是否构成漂绿的判断,并提供相应的理由。4) 分类模块:基于生成模块的输出,对企业声明进行分类,判断其是否构成漂绿。
关键创新:EmeraldMind的关键创新在于将领域知识图谱与检索增强生成技术相结合,用于漂绿检测。与直接使用通用大型语言模型相比,EmeraldMind能够利用结构化的领域知识,提供更准确、更可信的判断结果。此外,EmeraldMind还能够提供证据支持的理由,增强了判断的可解释性。
关键设计:EmeraldGraph的构建需要仔细设计实体和关系的schema,以确保能够覆盖企业ESG报告中的关键信息。检索模块需要采用高效的检索算法,以便快速找到相关的证据。生成模块需要选择合适的预训练语言模型,并进行适当的prompt工程,以确保能够生成准确、可信的判断结果。论文中没有明确提及具体的参数设置、损失函数或网络结构等技术细节,这部分信息未知。
🖼️ 关键图片
📊 实验亮点
EmeraldMind在新的漂绿声明数据集上进行了实验,结果表明,与通用LLM相比,EmeraldMind实现了具有竞争力的准确性、更大的覆盖范围和卓越的解释质量,而无需进行微调或重新训练。具体的性能数据和提升幅度在摘要中没有明确给出,这部分信息未知。
🎯 应用场景
EmeraldMind框架可应用于多个领域,包括环境监管、投资决策和消费者权益保护。它可以帮助监管机构自动监测企业的环境声明,识别潜在的漂绿行为。投资者可以利用该框架评估企业的真实可持续发展水平,做出更明智的投资决策。消费者可以通过该框架识别虚假宣传,选择真正环保的产品和服务。未来,该框架可以扩展到其他领域,例如社会责任和公司治理。
📄 摘要(原文)
As AI and web agents become pervasive in decision-making, it is critical to design intelligent systems that not only support sustainability efforts but also guard against misinformation. Greenwashing, i.e., misleading corporate sustainability claims, poses a major challenge to environmental progress. To address this challenge, we introduce EmeraldMind, a fact-centric framework integrating a domain-specific knowledge graph with retrieval-augmented generation to automate greenwashing detection. EmeraldMind builds the EmeraldGraph from diverse corporate ESG (environmental, social, and governance) reports, surfacing verifiable evidence, often missing in generic knowledge bases, and supporting large language models in claim assessment. The framework delivers justification-centric classifications, presenting transparent, evidence-backed verdicts and abstaining responsibly when claims cannot be verified. Experiments on a new greenwashing claims dataset demonstrate that EmeraldMind achieves competitive accuracy, greater coverage, and superior explanation quality compared to generic LLMs, without the need for fine-tuning or retraining.