Generating Place-Based Compromises Between Two Points of View
作者: Sumanta Bhattacharyya, Francine Chen, Scott Carter, Yan-Ying Chen, Tatiana Lau, Nayeli Suseth Bravo, Monica P. Van, Kate Sieck, Charlene C. Wu
分类: cs.CL
发布日期: 2026-04-27
💡 一句话要点
提出基于同理心中立性的LLM提示方法,生成更易接受的观点折衷方案
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 折衷方案生成 同理心中立性 提示工程 偏好对齐 人机交互 自然语言处理
📋 核心要点
- 现有方法在生成折衷方案时缺乏同理心,导致结果难以被双方接受,这是一个挑战。
- 论文提出利用外部同理心相似度作为反馈,迭代优化LLM生成的折衷方案,提升其同理心中立性。
- 实验表明,该方法优于标准思维链推理,且通过偏好对齐训练的小模型在效率和效果上均有提升。
📝 摘要(中文)
大型语言模型(LLMs)在学术方面表现出色,但在社交智能任务(如创建良好的折衷方案)方面表现不佳。本文提出了一种在两种对立观点之间生成具有同理心中立性的折衷方案的方法。我们首先使用Claude 3 Opus和包含2400个关于共享场所的对比观点的的数据集,比较了四种不同的提示工程方法。对生成的部分折衷方案进行了50人参与的研究,以评估其可接受性。我们发现,在两种观点之间生成折衷方案的最佳方法是使用外部同理心相似度作为迭代反馈,优于标准的思维链(CoT)推理。结果表明,使用同理心中立性提高了折衷方案的可接受性。然后,使用生成的折衷方案数据集,通过基于边际的人类偏好对齐来训练两个较小的基础模型,从而提高了效率,并消除了推理过程中对同理心估计的需求。
🔬 方法详解
问题定义:论文旨在解决如何利用大型语言模型(LLMs)在两个对立观点之间生成更易于接受的折衷方案的问题。现有的方法,例如直接生成或使用思维链(Chain of Thought, CoT)推理,通常无法充分考虑到双方的感受,导致生成的折衷方案偏向一方或缺乏同理心,难以被双方接受。
核心思路:论文的核心思路是利用“同理心中立性”作为指导原则,通过外部同理心相似度来评估和优化LLM生成的折衷方案。具体来说,就是让生成的折衷方案在情感上尽量不偏向任何一方,从而提高其被双方接受的可能性。
技术框架:整体框架包含以下几个主要阶段:1) 使用不同的提示工程方法(包括CoT和基于同理心相似度的迭代反馈)生成多个折衷方案;2) 使用外部同理心模型评估每个折衷方案与两个对立观点的同理心相似度;3) 选择同理心中立性最高的折衷方案;4) 使用生成的数据集,通过基于边际的人类偏好对齐来训练更小的模型。
关键创新:最重要的技术创新点在于将“同理心中立性”的概念引入到折衷方案生成中,并利用外部同理心模型来指导LLM的生成过程。与传统的CoT方法相比,该方法能够更好地平衡双方的观点,生成更公平、更易于接受的折衷方案。此外,通过偏好对齐训练小模型,实现了效率的提升,并消除了推理过程中对同理心估计的需求。
关键设计:论文使用了Claude 3 Opus作为基础LLM,并设计了四种不同的提示工程方法,包括标准CoT和基于同理心相似度的迭代反馈。同理心相似度通过外部模型计算,用于评估折衷方案与两个对立观点的相似程度。在训练小模型时,使用了基于边际的人类偏好对齐方法,通过比较不同折衷方案的优劣,来优化模型的参数。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于同理心相似度的迭代反馈方法在生成折衷方案方面优于标准思维链(CoT)推理。通过人类评估,发现使用同理心中立性可以显著提高折衷方案的可接受性。此外,通过偏好对齐训练的小模型在保持性能的同时,显著提高了效率,并消除了推理过程中对同理心估计的需求。
🎯 应用场景
该研究成果可应用于各种需要观点协调和冲突解决的场景,例如在线协商、政策制定、社区管理等。通过自动生成具有同理心中立性的折衷方案,可以促进沟通,减少冲突,并提高决策效率。未来,该技术有望集成到智能助手和在线平台中,为用户提供更智能、更人性化的协商和决策支持。
📄 摘要(原文)
Large Language Models (LLMs) excel academically but struggle with social intelligence tasks, such as creating good compromises. In this paper, we present methods for generating empathically neutral compromises between two opposing viewpoints. We first compared four different prompt engineering methods using Claude 3 Opus and a dataset of 2,400 contrasting views on shared places. A subset of the gen erated compromises was evaluated for acceptability in a 50-participant study. We found that the best method for generating compromises between two views used external empathic similarity between a compromise and each viewpoint as iterative feedback, outperforming stan dard Chain of Thought (CoT) reasoning. The results indicate that the use of empathic neutrality improves the acceptability of compromises. The dataset of generated compromises was then used to train two smaller foundation models via margin-based alignment of human preferences, improving efficiency and removing the need for empathy estimation during inference.