Human vs. NAO: A Computational-Behavioral Framework for Quantifying Social Orienting in Autism and Typical Development
作者: Vartika Narayani Srinet, Anirudha Bhattacharjee, Braj Bhushan, Bishakh Bhattacharya
分类: cs.HC, cs.RO
发布日期: 2026-03-24
💡 一句话要点
提出计算行为框架,量化自闭症和典型发育儿童对人类和NAO机器人社交引导的差异。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 自闭症谱系障碍 社交定向 人机交互 机器人辅助评估 计算机视觉
📋 核心要点
- 自闭症儿童在对名字的反应上,通常表现出频率降低、延迟增加或反应模式异常等问题,现有方法难以精细化量化这些差异。
- 本研究提出一种计算行为框架,通过分析儿童对人类和NAO机器人呼唤名字的反应,量化社交定向行为的差异。
- 通过视频分析技术,提取眼动、头部姿态等细粒度行为特征,对比神经典型和非典型儿童的反应,为自闭症评估提供依据。
📝 摘要(中文)
本研究旨在量化自闭症谱系障碍(ASD)儿童和典型发育儿童对呼唤名字这一早期社交行为的反应差异。研究对比了人类和NAO机器人发出的呼唤名字刺激,分析了包括眼神交流、反应延迟、头部和面部方向变化以及持续兴趣时长等多个行为参数。研究采用基于视频的计算方法,结合人脸检测、眼部区域追踪和时空面部分析,以获取儿童反应的精细化测量数据。通过在受控的人机交互条件下比较神经典型和神经非典型儿童,旨在理解社交线索的来源和形式如何影响呼唤名字情境下的注意力动态。研究结果有助于深入理解自闭症的社交定向缺陷,并推动机器人辅助评估工具的应用开发。
🔬 方法详解
问题定义:本研究旨在解决自闭症儿童在社交定向行为,特别是对呼唤名字的反应上,与典型发育儿童存在的差异难以量化的问题。现有方法通常依赖主观观察或简单的行为计数,缺乏精细化、客观的评估手段,难以捕捉细微的行为模式差异。
核心思路:核心思路是通过构建一个受控的人机交互环境,对比自闭症儿童和典型发育儿童对人类和NAO机器人呼唤名字的反应。利用计算机视觉技术自动提取并量化儿童的行为特征,从而客观地评估其社交定向能力。通过对比不同刺激源(人类 vs. 机器人)的影响,深入理解自闭症儿童的社交认知机制。
技术框架:整体框架包括以下几个主要模块:1) 数据采集:录制儿童与人类或NAO机器人交互的视频;2) 人脸检测与跟踪:使用人脸检测算法定位视频中的人脸,并进行持续跟踪;3) 眼部区域跟踪:精确跟踪眼部区域,分析眼神交流情况;4) 头部和面部姿态分析:提取头部和面部的方向变化,量化注意力转移;5) 行为特征提取:计算反应延迟、持续兴趣时长等行为参数;6) 统计分析:对比神经典型和神经非典型儿童在不同条件下的行为特征差异。
关键创新:关键创新在于将计算机视觉技术应用于自闭症儿童的社交行为评估,实现了行为特征的自动化、精细化量化。通过对比人类和机器人刺激,揭示了社交线索来源对自闭症儿童注意力动态的影响。该方法为开发客观、可靠的机器人辅助评估工具奠定了基础。
关键设计:在视频分析方面,采用了基于深度学习的人脸检测和眼部跟踪算法,确保了在不同光照条件和面部表情下的鲁棒性。在行为特征提取方面,定义了多个关键参数,如反应延迟、眼神交流时长、头部转动角度等,以全面描述儿童的社交定向行为。统计分析方面,采用了合适的统计检验方法,以评估不同组别之间的差异显著性。
🖼️ 关键图片
📊 实验亮点
该研究通过对比神经典型和神经非典型儿童对人类和NAO机器人呼唤名字的反应,发现自闭症儿童在眼神交流、反应延迟等方面存在显著差异。通过量化这些差异,为自闭症的客观评估提供了新的指标。研究结果表明,机器人可以作为一种有效的社交刺激源,用于评估和干预自闭症儿童的社交行为。
🎯 应用场景
该研究成果可应用于自闭症的早期筛查和诊断,为临床医生提供客观的评估依据。此外,该方法还可以用于评估机器人辅助干预的效果,优化机器人与自闭症儿童的交互策略。未来,该技术有望推广到其他社交障碍的评估和干预中,提升康复效果。
📄 摘要(原文)
Responding to one's name is among the earliest-emerging social orienting behaviors and is one of the most prominent aspects in the detection of Autism Spectrum Disorder (ASD). Typically developing children exhibit near-reflexive orienting to their name, whereas children with ASD often demonstrate reduced frequency, increased latency, or atypical patterns of response. In this study, we examine differential responsiveness to quantify name-calling stimuli delivered by both human agents and NAO, a humanoid robot widely employed in socially assistive interventions for autism. The analysis focuses on multiple behavioral parameters, including eye contact, response latency, head and facial orientation shifts, and duration of sustained interest. Video-based computational methods were employed, incorporating face detection, eye region tracking, and spatio-temporal facial analysis, to obtain fine-grained measures of children's responses. By comparing neurotypical and neuroatypical groups under controlled human-robot conditions, this work aims to understand how the source and modality of social cues affect attentional dynamics in name-calling contexts. The findings advance both the theoretical understanding of social orienting deficits in autism and the applied development of robot-assisted assessment tools.