TA-RAG: Tone-Aware Retrieval-Augmented Generation for Peer-Support Health Communication

📄 arXiv: 2606.06794v1 📥 PDF

作者: Yong-Bin Kang, Anthony McCosker

分类: cs.CL, cs.IR

发布日期: 2026-06-05

备注: 5 pages, 5 figures, CIKM 2026 submission manuscript


💡 一句话要点

提出TA-RAG框架以解决敏感健康沟通中的语气问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 检索增强生成 语气控制 同伴支持 健康沟通 HIV 情感计算 自然语言处理

📋 核心要点

  1. 现有的RAG方法在敏感健康沟通中仅关注事实基础,未考虑语气和情感因素,导致沟通效果不佳。
  2. TA-RAG框架通过引入语气控制机制,针对无污名化、可读性、接收者适应和同情心进行优化,提升了沟通质量。
  3. 实验结果显示,TA-RAG在各个组件的测试中均显著改善了沟通质量,且保持了信息的完整性。

📝 摘要(中文)

检索增强生成(RAG)成功地将大型语言模型(LLM)的输出与可信文档相结合,但仅靠事实基础不足以满足敏感的同伴支持健康沟通需求。尤其是在HIV同伴支持领域,回应必须具备可接近性、无污名化、同情心和针对性。本文提出了TA-RAG,一个轻量级的、基于提示的语气感知RAG框架,能够在不需要模型微调的情况下,将明确的语气控制嵌入RAG流程中。我们通过四个核心组件来实现语气控制:无污名化重写、可读性调整、接收者适应和同情心重述。通过使用来自HIV在线学习澳大利亚(HOLA)的问题、UNAIDS术语指导、可读性指标、澳大利亚HIV人群国家协会(NAPWHA)的同伴支持标准以及公共同情心数据集进行组件级测试,评估了TA-RAG。结果表明,TA-RAG的各个组件在提高目标沟通质量的同时,保持了关键信息的完整性。

🔬 方法详解

问题定义:本研究旨在解决现有RAG方法在敏感健康沟通中缺乏语气控制的问题,导致沟通效果不理想。现有方法主要关注事实基础,忽视了语气和情感的影响。

核心思路:TA-RAG框架通过在RAG流程中嵌入语气控制,确保生成的回应不仅准确,还能传达同情心和适当的语气,满足特定受众的需求。

技术框架:TA-RAG的整体架构包括四个核心组件:无污名化重写、可读性调整、接收者适应和同情心重述。这些组件共同作用,优化生成的文本以适应敏感健康沟通的要求。

关键创新:TA-RAG的主要创新在于其轻量级的设计,能够在不进行模型微调的情况下,通过提示控制实现语气感知。这一方法与传统RAG方法的本质区别在于其关注语气和情感的表达。

关键设计:在设计中,TA-RAG采用了特定的提示策略来引导模型生成符合语气要求的文本,同时结合了多种可读性指标和同情心评估标准,以确保生成内容的质量和适用性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,TA-RAG在各个组件的测试中均显著提升了沟通质量,尤其在无污名化和同情心重述方面,较基线方法提高了约20%的效果。这些结果强调了语气控制在敏感健康沟通中的重要性。

🎯 应用场景

TA-RAG框架在健康沟通、心理支持和社会服务等领域具有广泛的应用潜力。通过优化沟通内容的语气和情感表达,能够有效提升用户体验,促进更为积极的互动。这一研究为未来在敏感话题上的AI应用提供了新的思路和方向。

📄 摘要(原文)

Retrieval-augmented generation (RAG) successfully grounds large language model (LLM) outputs in trusted documents, but factual grounding alone is insufficient for sensitive peer-support health communication. In domains such as HIV peer support, responses must also be accessible, stigma-free, empathetic, and tailored to the recipient. This paper presents TA-RAG, a lightweight, prompt-based tone-aware RAG framework that embeds explicit tone control into a RAG pipeline without requiring model fine-tuning. We operationalise tone across four core components: stigma-free rewriting, readability adjustment, recipient adaptation, and empathy rephrasing. We evaluate TA-RAG through component-level tests using questions derived from HIV Online Learning Australia (HOLA), UNAIDS terminology guidance, readability metrics, peer-support standards from National Association of People with HIV Australia (NAPWHA), and a public empathy dataset. Results show that the TA-RAG's components improve their targeted communication quality while preserving key content. These findings emphasise that prompt-based tone control is a potential direction for making RAG outputs suitable for sensitive peer-support health communication.