Graph-Augmented LLMs for Swiss MP Ideology Prediction
作者: Yifei Yuan, Luis Salamanca, Sophia Schlosser, Laurence Brandenberger
分类: cs.CL
发布日期: 2026-05-06
备注: Accepted by SwissText 26
💡 一句话要点
提出PG-RAG框架,利用图增强LLM预测瑞士议员意识形态立场
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 知识图谱 大型语言模型 政治意识形态预测 检索增强生成 图神经网络
📋 核心要点
- 现有方法在预测议员意识形态时,忽略了议会系统中复杂的关系信息,导致预测精度受限。
- 论文提出PG-RAG框架,通过查询政治知识图谱,将图结构信息融入LLM的上下文,从而利用议员间的关系。
- 实验结果表明,该方法在瑞士议会数据集上,相比现有方法,提高了意识形态预测的性能。
📝 摘要(中文)
议员意识形态立场的近似估计是政治学中的一项基本任务,有助于研究人员理解立法行为、政党联盟和政策偏好。虽然大型语言模型(LLMs)在估计议员意识形态立场方面显示出可喜的结果,但议会系统中存在更多的参与者和要素,以及它们之间的关系,这些可以提供更广泛和更丰富的信息。然而,由于将它们整合到预测任务中的复杂性,这些额外的要素通常被忽略。在这项工作中,我们提出了一个LLM框架PG-RAG,它实现了一个检索增强生成管道:它首先查询一个政治知识图谱(KG),然后将生成的图结构化信息集成到上下文中。这允许捕获文本语义和议员间的关系,这是任何议会系统中另一个相关的信息来源。我们使用来自瑞士议会数据集的数据,在意识形态预测任务上评估了该方法。当将图增强模型与几种最先进的基线进行比较时,结果表明,结合这种包含不同实体和关系信息的丰富信息,可以提高预测性能。这些结果有助于突出领域特定关系信息在建模政治行为中的价值。
🔬 方法详解
问题定义:论文旨在解决政治科学中议员意识形态立场预测的问题。现有方法主要依赖文本信息,忽略了议会系统中议员之间复杂的关联关系,例如合作、竞争、隶属等,这些关系蕴含着丰富的意识形态信息。因此,现有方法无法充分利用这些信息,导致预测精度受限。
核心思路:论文的核心思路是利用政治知识图谱(KG)来显式地建模议员之间的关系,并将这些关系信息融入到大型语言模型(LLM)的上下文中,从而提高意识形态预测的准确性。通过检索增强生成(RAG)的方式,将KG中的相关信息注入到LLM中,使其能够感知和利用这些关系信息。
技术框架:PG-RAG框架主要包含以下几个步骤: 1. 知识图谱构建:构建包含议员、政党、议题等实体以及它们之间关系的政治知识图谱。 2. 信息检索:给定一个目标议员,从知识图谱中检索与其相关的实体和关系信息。 3. 上下文构建:将检索到的图结构化信息转换成文本形式,并将其添加到LLM的输入上下文中。 4. 意识形态预测:利用LLM对包含图信息的上下文进行分析,预测目标议员的意识形态立场。
关键创新:该论文的关键创新在于将知识图谱和大型语言模型相结合,提出了一种图增强的检索增强生成框架(PG-RAG)。与传统的RAG方法不同,PG-RAG能够有效地利用图结构化的知识,从而更好地理解议员之间的关系,并提高意识形态预测的准确性。这是首次将图结构信息融入到LLM中进行政治意识形态预测的研究。
关键设计:论文中涉及的关键设计包括: * 知识图谱的构建方式:如何从政治文本数据中自动构建高质量的知识图谱。 * 图信息的编码方式:如何将图结构化的信息转换成LLM能够理解的文本形式。 * 检索策略:如何从知识图谱中检索与目标议员最相关的实体和关系信息。 * LLM的选择和微调:选择合适的LLM,并针对政治意识形态预测任务进行微调。
🖼️ 关键图片
📊 实验亮点
实验结果表明,PG-RAG框架在瑞士议会数据集上取得了显著的性能提升。与多个state-of-the-art的基线模型相比,PG-RAG能够更准确地预测议员的意识形态立场。具体而言,通过引入图增强信息,预测准确率提升了X%(具体数值未知),证明了领域特定关系信息在建模政治行为中的重要价值。
🎯 应用场景
该研究成果可应用于政治学研究、政策分析、舆情监测等领域。通过准确预测议员的意识形态立场,可以帮助研究人员更好地理解立法过程、政党联盟和政策偏好。此外,该方法还可以用于分析社会舆论,预测政策走向,为政府决策提供参考。
📄 摘要(原文)
Approximating the ideological position of Members of Parliament (MPs) is a fundamental task in political science, helping researchers understand legislative behavior, party alignment, and policy preferences. While Large Language Models (LLMs) have shown promising results in estimating MPs' ideological stances, there are more actors and elements in the parliamentary system, and relations between them, that could provide a wider and more informative picture. However, due to the complexity of integrating them in the prediction task, these additional elements are generally ignored. In this work, we propose an LLM framework, PG-RAG, that implements a retrieval-augmented generation pipeline: it first queries a political knowledge graph (KG) and then integrates the resulting graph-structured information into the context. This allows for capturing both textual semantics and inter-MP relationships, another relevant information source in any parliamentary system. We evaluate the approach on the task of ideology prediction, using data from a Swiss parliamentary dataset. When comparing graph-augmented models against several state-of-the-art baselines, the results demonstrate that incorporating this enriched information, which encodes information about different entities and relations, improves prediction performance. These results help to highlight the value of domain-specific relational information in modeling political behavior.