Detecting Religious Language in Climate Discourse
作者: Evy Beijen, Pien Pieterse, Yusuf Çelik, Willem Th. van Peursen, Sandjai Bhulai, Meike Morren
分类: cs.CL, cs.AI
发布日期: 2025-10-27
💡 一句话要点
提出一种双重方法检测气候讨论中的宗教语言,对比规则模型与大语言模型。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 宗教语言检测 气候讨论 自然语言处理 规则模型 大语言模型
📋 核心要点
- 现有方法难以准确识别气候讨论中隐性的宗教语言,尤其是在区分词汇本身和语境意义方面存在挑战。
- 论文提出一种双重方法,结合基于规则的模型(利用生态神学术语)和零样本大语言模型,以检测气候文本中的宗教语言。
- 实验结果表明,基于规则的模型倾向于将更多句子标记为宗教性的,突显了两种方法在检测宗教语言方面的差异。
📝 摘要(中文)
宗教语言持续渗透到当代讨论中,即使在环境行动主义和气候变化辩论等表面上世俗的领域也是如此。本文研究了显性和隐性形式的宗教语言如何在世俗和宗教非政府组织 (NGO) 产生的气候相关文本中出现。我们介绍了一种双重方法:一种使用源自生态神学文献的宗教术语分层树的基于规则的模型,以及在零样本设置中运行的大型语言模型 (LLM)。使用超过 880,000 个句子的数据集,我们比较了这些方法如何检测宗教语言,并分析了它们的一致性和差异性。结果表明,基于规则的方法始终比 LLM 标记更多的句子为宗教性的。这些发现不仅突出了计算检测宗教语言的方法论挑战,也突出了关于宗教语言应该仅由词汇定义还是由语境意义定义的更广泛的争论。这项研究通过展示分析神圣性如何在气候讨论中持续存在的方法的潜力和局限性,为宗教研究中的数字方法做出了贡献。
🔬 方法详解
问题定义:论文旨在解决在气候讨论等领域中,如何准确检测和识别宗教语言的问题。现有方法,尤其是基于词汇匹配的方法,难以捕捉隐性的宗教语言,并且无法区分词汇的字面意义和在特定语境下的宗教含义。这导致对宗教影响力的评估可能不准确。
核心思路:论文的核心思路是结合两种互补的方法:一种是基于规则的模型,它依赖于预定义的宗教术语和概念;另一种是使用大语言模型(LLM)进行零样本学习,利用其对语境的理解能力。通过比较这两种方法的检测结果,可以更全面地了解宗教语言在气候讨论中的存在形式和程度。
技术框架:该研究的技术框架包括以下几个主要步骤:1) 构建包含气候相关文本的大型数据集,包括来自世俗和宗教非政府组织(NGO)的文本。2) 开发基于规则的模型,该模型使用源自生态神学文献的宗教术语分层树。3) 使用预训练的大语言模型(LLM)在零样本设置下进行宗教语言检测。4) 比较两种方法的检测结果,分析它们的一致性和差异性。5) 对结果进行定性分析,以深入了解宗教语言在气候讨论中的作用。
关键创新:该研究的关键创新在于其双重方法,它结合了基于规则的模型和基于LLM的方法,从而能够更全面地检测和分析宗教语言。与传统方法相比,这种方法不仅可以识别显性的宗教术语,还可以捕捉隐性的宗教含义,并考虑语境因素。
关键设计:基于规则的模型使用宗教术语的分层树,该树是从生态神学文献中提取的。LLM在零样本设置中使用,无需针对特定任务进行微调。研究人员比较了两种方法标记为宗教性的句子的数量,并分析了它们之间的差异。具体的参数设置和网络结构取决于所使用的大语言模型,论文中可能未详细说明。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于规则的模型始终比大语言模型(LLM)标记更多的句子为宗教性的,这表明基于规则的模型更容易识别显性的宗教术语,而LLM可能更擅长捕捉隐性的宗教含义。两种方法在检测结果上存在显著差异,突显了在计算检测宗教语言时需要考虑方法选择。
🎯 应用场景
该研究成果可应用于社会科学、宗教学、政治学等领域,帮助研究人员分析宗教语言在公共领域的影响,例如在环境政策制定、社会运动和政治辩论中的作用。此外,该方法还可以用于检测其他类型的意识形态语言,从而促进对社会话语的更深入理解。
📄 摘要(原文)
Religious language continues to permeate contemporary discourse, even in ostensibly secular domains such as environmental activism and climate change debates. This paper investigates how explicit and implicit forms of religious language appear in climate-related texts produced by secular and religious nongovernmental organizations (NGOs). We introduce a dual methodological approach: a rule-based model using a hierarchical tree of religious terms derived from ecotheology literature, and large language models (LLMs) operating in a zero-shot setting. Using a dataset of more than 880,000 sentences, we compare how these methods detect religious language and analyze points of agreement and divergence. The results show that the rule-based method consistently labels more sentences as religious than LLMs. These findings highlight not only the methodological challenges of computationally detecting religious language but also the broader tension over whether religious language should be defined by vocabulary alone or by contextual meaning. This study contributes to digital methods in religious studies by demonstrating both the potential and the limitations of approaches for analyzing how the sacred persists in climate discourse.