PediaMind-R1: A Temperament-Aware Language Model for Personalized Early Childhood Care Reasoning via Cognitive Modeling and Preference Alignment

📄 arXiv: 2601.08848v1 📥 PDF

作者: Zihe Zhang, Can Zhang, Yanheng Xu, Xin Hu, Jichao Leng

分类: cs.CL, cs.AI

发布日期: 2025-12-22

备注: Accepted at EMNLP 2025 PALS Workshop (PALS: EXPLORING ACTIVE AND PASSIVE LLM PERSONALIZATION)


💡 一句话要点

PediaMind-R1:基于认知建模和偏好对齐的个性化育儿语言模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 个性化育儿 大型语言模型 气质理论 认知建模 偏好对齐 思维链 GRPO

📋 核心要点

  1. 现有育儿系统缺乏个性化,无法根据儿童气质提供针对性建议,PediaMind-R1旨在解决这一问题。
  2. PediaMind-R1结合气质理论构建知识图谱,并通过两阶段训练流程提升模型在育儿领域的推理能力。
  3. 实验结果表明,PediaMind-R1能够准确解读幼儿气质,并进行个性化推理,提升育儿建议的质量。

📝 摘要(中文)

本文提出了PediaMind-R1,一个领域专用的大型语言模型,旨在实现智能育儿场景中的主动个性化。与提供通用建议的传统系统不同,PediaMind-R1借鉴了发展心理学的见解,引入了Thomas-Chess框架中的气质理论,并构建了一个针对婴幼儿(0-3岁)的气质知识图谱。我们的两阶段训练流程首先使用监督式微调来教授结构化的思维链推理,然后应用基于GRPO的对齐阶段来加强逻辑一致性、领域专业知识和共情关怀策略。我们进一步设计了一个评估框架,包括气质敏感的多项选择题和人工评估。结果表明,PediaMind-R1可以准确地解释幼儿气质特征,并主动参与个性化推理。这项工作突出了将垂直领域建模与心理学理论相结合的价值,为开发以用户为中心的大型语言模型提供了一种新颖的方法,从而推进了敏感护理环境中的主动个性化实践。

🔬 方法详解

问题定义:现有智能育儿系统通常提供通用的建议,忽略了儿童个体差异,特别是气质类型对育儿方式的影响。这导致建议缺乏针对性,可能无法有效解决实际问题。论文旨在构建一个能够理解和利用儿童气质信息的个性化育儿语言模型。

核心思路:论文的核心思路是将发展心理学中的气质理论融入大型语言模型中,使其能够理解不同气质类型的儿童的需求,并根据这些信息进行个性化的育儿建议。通过构建气质知识图谱和设计特定的训练流程,模型能够模拟人类育儿专家的思考方式,提供更具针对性和实用性的建议。

技术框架:PediaMind-R1的训练流程分为两个阶段。第一阶段是监督式微调(SFT),使用包含结构化思维链的育儿知识数据,训练模型进行推理。第二阶段是基于GRPO(Generative Preference Optimization)的对齐阶段,通过人类反馈来优化模型的逻辑一致性、领域专业知识和共情关怀能力。评估框架包括气质敏感的多项选择题和人工评估,用于全面评估模型的性能。

关键创新:该论文的关键创新在于将心理学理论(气质理论)与大型语言模型相结合,构建了一个领域专用的个性化育儿模型。与传统的通用语言模型相比,PediaMind-R1能够更好地理解儿童的个体差异,并提供更具针对性的育儿建议。此外,基于GRPO的对齐阶段能够有效提升模型的逻辑性和专业性。

关键设计:气质知识图谱是关键的设计之一,它包含了不同气质类型的儿童的特征和需求。在训练过程中,论文使用了结构化的思维链数据,引导模型进行推理。GRPO对齐阶段使用了人类反馈数据,优化模型的偏好。具体参数设置和网络结构细节在论文中可能未详细公开,属于技术保密部分。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

PediaMind-R1在气质敏感的多项选择题和人工评估中表现出色,能够准确解读幼儿气质特征,并提供个性化的育儿建议。具体性能数据和对比基线在论文中进行了详细展示,表明PediaMind-R1在个性化育儿方面具有显著优势。

🎯 应用场景

PediaMind-R1可应用于智能育儿助手、在线育儿咨询平台、个性化育儿课程推荐等领域。通过提供个性化的育儿建议,帮助家长更好地了解和照顾孩子,促进儿童的健康发展。该研究有望推动人工智能在育儿领域的应用,提升育儿服务的质量和效率。

📄 摘要(原文)

This paper presents PediaMind-R1, a domain-specialized large language model designed to achieve active personalization in intelligent parenting scenarios. Unlike conventional systems that provide generic suggestions, PediaMind-R1 draws on insights from developmental psychology. It introduces temperament theory from the Thomas-Chess framework and builds a temperament knowledge graph for infants and toddlers (0-3 years). Our two-stage training pipeline first uses supervised fine-tuning to teach structured chain-of-thought reasoning, and then applies a GRPO-based alignment stage to reinforce logical consistency, domain expertise, and empathetic caregiving strategies. We further design an evaluation framework comprising temperament-sensitive multiple-choice tests and human assessments. The results demonstrate that PediaMind-R1 can accurately interpret early childhood temperament profiles and proactively engage in individualized reasoning. This work highlights the value of integrating vertical-domain modeling with psychological theory. It offers a novel approach to developing user-centered LLMs that advance the practice of active personalization in sensitive caregiving contexts.