SS-GEN: A Social Story Generation Framework with Large Language Models
作者: Yi Feng, Mingyang Song, Jiaqi Wang, Zhuang Chen, Guanqun Bi, Minlie Huang, Liping Jing, Jian Yu
分类: cs.CL
发布日期: 2024-06-22 (更新: 2025-07-04)
备注: AAAI 2025 (Oral)
💡 一句话要点
SS-GEN:利用大语言模型生成社交故事,辅助自闭症儿童理解社会情境。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 社交故事生成 自闭症谱系障碍 大语言模型 约束驱动生成 迁移学习
📋 核心要点
- 自闭症儿童难以理解社会情境,传统社交故事编写成本高昂且内容有限,难以满足个性化需求。
- SS-GEN框架通过StarSow策略引导LLMs生成社交故事,并构建高质量数据集微调小型语言模型。
- 实验表明,微调后的小型语言模型能够以较低成本和复杂度生成与大型模型效果相当的社交故事。
📝 摘要(中文)
本文提出SS-GEN框架,利用大语言模型(LLMs)自动生成社交故事,旨在为自闭症谱系障碍(ASD)儿童提供更经济、多样化的辅助工具。传统社交故事由专家编写,成本高且覆盖面有限。SS-GEN首先设计了一种名为StarSow的约束驱动策略,分层提示LLMs大规模生成社交故事,并通过人工筛选构建高质量数据集。其次,引入质量评估标准来评估生成故事的有效性。最后,考虑到闭源大模型指令复杂且API费用高昂,使用高质量数据集微调小型语言模型,以较低成本和更简单的指令及部署实现可比结果。这项工作标志着利用AI大规模个性化定制社交故事的重要一步,有望促进未来对特殊群体的研究。
🔬 方法详解
问题定义:论文旨在解决为自闭症儿童生成高质量、个性化社交故事的问题。现有方法主要依赖专家手工编写,存在成本高、效率低、覆盖面窄等痛点,难以满足大规模个性化需求。
核心思路:论文的核心思路是利用大语言模型(LLMs)的强大生成能力,结合约束驱动的提示策略,自动生成社交故事。通过人工筛选和微调,降低对大型闭源模型的依赖,实现低成本、高效益的社交故事生成。
技术框架:SS-GEN框架包含三个主要阶段:1) StarSow策略驱动的LLM生成:设计分层提示策略,引导LLMs生成符合社交故事规范的文本。2) 高质量数据集构建:通过人工筛选,过滤掉不符合要求的生成结果,构建高质量的训练数据集。3) 小型语言模型微调:使用高质量数据集微调小型语言模型,使其具备生成高质量社交故事的能力。
关键创新:论文的关键创新在于提出了StarSow约束驱动的提示策略,能够有效地引导LLMs生成符合社交故事规范的文本。此外,通过人工筛选构建高质量数据集,并使用该数据集微调小型语言模型,降低了对大型闭源模型的依赖,实现了低成本、高效益的社交故事生成。
关键设计:StarSow策略采用分层提示的方式,逐步引导LLMs生成社交故事的各个部分,包括情境描述、行为建议、结果预测等。具体参数设置和损失函数等技术细节在论文中未详细说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
论文通过实验验证了SS-GEN框架的有效性。结果表明,使用高质量数据集微调后的小型语言模型,在生成社交故事的质量上能够达到与大型闭源模型相当的水平,同时显著降低了成本和部署复杂度。具体的性能数据和对比基线在摘要中未提及,属于未知信息。
🎯 应用场景
该研究成果可应用于自闭症儿童的早期干预和康复训练,为其提供个性化的社交技能学习资源。此外,该方法也可推广到其他特殊群体的辅助教育领域,例如为学习障碍儿童定制学习材料,或为老年痴呆症患者提供认知训练内容。未来,结合虚拟现实等技术,可进一步提升社交故事的互动性和沉浸感。
📄 摘要(原文)
Children with Autism Spectrum Disorder (ASD) often misunderstand social situations and struggle to participate in daily routines. Social Stories are traditionally crafted by psychology experts under strict constraints to address these challenges but are costly and limited in diversity. As Large Language Models (LLMs) advance, there's an opportunity to develop more automated, affordable, and accessible methods to generate Social Stories in real-time with broad coverage. However, adapting LLMs to meet the unique and strict constraints of Social Stories is a challenging issue. To this end, we propose SS-GEN, a Social Story GENeration framework with LLMs. Firstly, we develop a constraint-driven sophisticated strategy named StarSow to hierarchically prompt LLMs to generate Social Stories at scale, followed by rigorous human filtering to build a high-quality dataset. Additionally, we introduce quality assessment criteria to evaluate the effectiveness of these generated stories. Considering that powerful closed-source large models require very complex instructions and expensive API fees, we finally fine-tune smaller language models with our curated high-quality dataset, achieving comparable results at lower costs and with simpler instruction and deployment. This work marks a significant step in leveraging AI to personalize Social Stories cost-effectively for autistic children at scale, which we hope can encourage future research on special groups.