CREW: Facilitating Human-AI Teaming Research
作者: Lingyu Zhang, Zhengran Ji, Boyuan Chen
分类: cs.HC, cs.AI, cs.LG
发布日期: 2024-07-31 (更新: 2025-01-01)
备注: Our project website is at: http://generalroboticslab.com/CREW
💡 一句话要点
CREW:用于人机协作研究的平台,支持实时决策场景和多学科协作。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 人机协作 人机交互 强化学习 认知科学 实时决策 多模态数据 平台 生理信号
📋 核心要点
- 现有的人机协作平台通常过于简化,或仅关注人类协作或多智能体算法,缺乏对复杂实时决策场景的支持。
- CREW平台通过模块化设计,提供预置任务和多模态生理信号记录,支持认知研究和人机协作,强调人类参与。
- CREW平台通过50项人类受试者研究验证了其基准的有效性,促进了实时人类引导的强化学习智能体的研究。
📝 摘要(中文)
随着人工智能技术的日益普及,人与AI智能体协同工作的潜力正在快速增长。人机协作是研究人类与AI智能体协同工作各个方面的重要范例。人机协作研究的独特之处在于需要联合研究人类和AI智能体,需要机器学习、人机交互、机器人、认知科学、神经科学、心理学、社会科学和复杂系统等多学科的研究力量。然而,现有的人机协作研究平台存在局限性,通常只支持过于简化的场景和单一任务,或者只专注于人类协作研究或多智能体AI算法。我们推出了CREW,一个促进实时决策场景下人机协作研究的平台,并鼓励多学科的合作,尤其强调人类的参与。它包括用于认知研究和人机协作的预置任务,并通过我们的模块化设计实现可扩展的潜力。遵循传统的认知神经科学研究,CREW还支持多模态的人类生理信号记录,用于行为分析。此外,CREW使用最先进的算法和精心调整的基线来评估实时人类引导的强化学习智能体。借助CREW,我们在一周内进行了50项人类受试者研究,以验证我们基准的有效性。
🔬 方法详解
问题定义:现有的人机协作研究平台存在局限性,无法满足复杂实时决策场景的需求。它们通常只支持过于简化的场景和单一任务,或者只专注于人类协作研究或多智能体AI算法,缺乏对人类行为和生理信号的综合分析能力。
核心思路:CREW平台的核心思路是构建一个模块化、可扩展的平台,支持多学科研究人员共同探索人机协作在实时决策场景下的各种问题。该平台强调人类的参与,并提供多模态数据采集和分析工具,以便深入了解人类的行为和认知过程。
技术框架:CREW平台包含以下主要模块:1) 预置任务模块,提供用于认知研究和人机协作的多种任务;2) 人机交互模块,支持人类与AI智能体之间的实时交互;3) 数据采集模块,支持多模态人类生理信号的记录,如脑电、眼动等;4) 行为分析模块,提供用于分析人类行为和认知过程的工具;5) 强化学习模块,用于评估实时人类引导的强化学习智能体。
关键创新:CREW平台的关键创新在于其综合性的人机协作研究能力。它不仅提供了一个统一的平台,支持多种任务和数据采集方式,还强调了人类的参与,并提供了用于分析人类行为和认知过程的工具。此外,CREW平台还提供了一套基准算法,用于评估实时人类引导的强化学习智能体。
关键设计:CREW平台的模块化设计使其具有很强的可扩展性,可以方便地添加新的任务、数据采集方式和分析工具。平台还提供了一套易于使用的API,方便研究人员进行二次开发。在强化学习模块中,平台使用了最先进的算法和精心调整的超参数,以确保基准算法的性能。
🖼️ 关键图片
📊 实验亮点
CREW平台在一周内进行了50项人类受试者研究,验证了其基准的有效性。实验结果表明,CREW平台可以有效地评估实时人类引导的强化学习智能体,并为研究人员提供有价值的数据和分析工具。这些实验证明了CREW平台在人机协作研究领域的潜力。
🎯 应用场景
CREW平台可应用于各种人机协作场景,如智能交通、医疗诊断、金融交易等。通过该平台,研究人员可以深入了解人类与AI智能体之间的交互模式,从而设计出更加高效、安全和可靠的人机协作系统。该研究的未来影响在于促进人机协作技术的广泛应用,提高生产效率和生活质量。
📄 摘要(原文)
With the increasing deployment of artificial intelligence (AI) technologies, the potential of humans working with AI agents has been growing at a great speed. Human-AI teaming is an important paradigm for studying various aspects when humans and AI agents work together. The unique aspect of Human-AI teaming research is the need to jointly study humans and AI agents, demanding multidisciplinary research efforts from machine learning to human-computer interaction, robotics, cognitive science, neuroscience, psychology, social science, and complex systems. However, existing platforms for Human-AI teaming research are limited, often supporting oversimplified scenarios and a single task, or specifically focusing on either human-teaming research or multi-agent AI algorithms. We introduce CREW, a platform to facilitate Human-AI teaming research in real-time decision-making scenarios and engage collaborations from multiple scientific disciplines, with a strong emphasis on human involvement. It includes pre-built tasks for cognitive studies and Human-AI teaming with expandable potentials from our modular design. Following conventional cognitive neuroscience research, CREW also supports multimodal human physiological signal recording for behavior analysis. Moreover, CREW benchmarks real-time human-guided reinforcement learning agents using state-of-the-art algorithms and well-tuned baselines. With CREW, we were able to conduct 50 human subject studies within a week to verify the effectiveness of our benchmark.