The Thousand Brains Project: A New Paradigm for Sensorimotor Intelligence
作者: Viviane Clay, Niels Leadholm, Jeff Hawkins
分类: cs.AI, q-bio.NC
发布日期: 2024-12-24
🔗 代码/项目: GITHUB
💡 一句话要点
提出千脑项目:一种基于新皮层原理的通用传感器运动智能新范式
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 千脑项目 新皮层 传感器运动智能 皮质柱 学习模块
📋 核心要点
- 现有AI系统在真实世界复杂环境中的泛化能力不足,无法像人类一样快速学习和适应新任务。
- 千脑项目模仿新皮层结构,提出由大量学习模块组成的系统,每个模块独立建模对象和运动。
- 该系统采用快速联想学习和空间结构归纳偏置,并通过皮质消息传递协议实现模块间的交互。
📝 摘要(中文)
人工智能在过去十年中发展迅速,这主要得益于深度学习系统规模的扩大。尽管取得了这些进展,但创建能够在各种真实世界环境中有效运行的智能系统仍然是一个重大挑战。本文概述了千脑项目,这是一项正在进行的研究工作,旨在开发一种替代的、互补的人工智能形式,该形式源自新皮层的工作原理。我们提出了一个千脑系统的早期版本,这是一个传感器运动代理,它非常适合快速学习各种任务,并最终实现人类新皮层拥有的任何能力。其设计的核心是使用重复的计算单元,即学习模块,该模块以哺乳动物大脑中的皮质柱为模型。每个学习模块作为一个半独立的单元运行,可以对整个对象进行建模,通过空间结构化的参考系表示信息,并且可以估计和影响世界中的运动。学习是一个快速的、联想的过程,类似于大脑中的赫布学习,并利用围绕世界空间结构的归纳偏差来实现快速和持续的学习。多个学习模块可以通过“皮质消息传递协议”(CMP)以分层和非分层的方式相互交互,从而创建更抽象的表示并支持多模态集成。我们概述了推动千脑系统设计的关键原则,并提供了有关 Monty(我们第一个此类系统的实例)的实现的详细信息。代码可以在 https://github.com/thousandbrainsproject/tbp.monty 找到,更详细的文档可以在 https://thousandbrainsproject.readme.io/ 找到。
🔬 方法详解
问题定义:现有深度学习方法在处理复杂、动态的真实世界环境时,面临泛化能力差、学习效率低等问题。它们难以像人类一样快速适应新任务,并且缺乏对空间结构的有效建模能力。
核心思路:千脑项目的核心思路是模仿哺乳动物新皮层的工作原理,构建一个由大量半独立学习模块组成的系统。每个模块负责建模特定的对象或概念,并通过空间参考框架来表示信息。这种模块化和分布式的结构能够提高系统的鲁棒性和可扩展性,并支持快速的联想学习。
技术框架:千脑系统的整体架构包含多个学习模块,每个模块都基于皮质柱的结构进行设计。这些模块通过“皮质消息传递协议”(CMP)进行通信,实现信息共享和协同工作。系统可以分为感知、运动和控制等多个层次,每个层次都由多个学习模块组成。Monty是该系统的一个具体实现,用于验证其可行性。
关键创新:该项目最重要的创新点在于其模仿大脑新皮层的结构和功能。与传统的深度学习模型不同,千脑系统采用模块化、分布式的架构,并利用空间参考框架来表示信息。这种设计使得系统能够更好地理解和处理真实世界中的复杂环境,并实现快速的联想学习。
关键设计:每个学习模块都包含多个神经元,这些神经元通过突触连接形成网络。学习过程基于赫布学习规则,即同时激活的神经元之间的连接会得到加强。空间参考框架用于表示对象的位置、方向和姿态等信息。皮质消息传递协议定义了模块之间通信的格式和规则。
🖼️ 关键图片
📊 实验亮点
Monty是千脑项目的一个早期实现,它展示了该系统在传感器运动控制方面的潜力。虽然论文中没有提供具体的性能数据,但Monty能够学习一些简单的任务,例如抓取物体和导航。这些结果表明,基于新皮层原理的AI系统具有快速学习和适应新任务的能力。
🎯 应用场景
千脑项目具有广泛的应用前景,例如机器人控制、自动驾驶、智能制造和虚拟现实等领域。它可以用于开发能够自主学习和适应复杂环境的智能系统,从而提高生产效率和生活质量。未来,该项目有望推动人工智能领域的发展,并为解决现实世界中的各种挑战提供新的思路。
📄 摘要(原文)
Artificial intelligence has advanced rapidly in the last decade, driven primarily by progress in the scale of deep-learning systems. Despite these advances, the creation of intelligent systems that can operate effectively in diverse, real-world environments remains a significant challenge. In this white paper, we outline the Thousand Brains Project, an ongoing research effort to develop an alternative, complementary form of AI, derived from the operating principles of the neocortex. We present an early version of a thousand-brains system, a sensorimotor agent that is uniquely suited to quickly learn a wide range of tasks and eventually implement any capabilities the human neocortex has. Core to its design is the use of a repeating computational unit, the learning module, modeled on the cortical columns found in mammalian brains. Each learning module operates as a semi-independent unit that can model entire objects, represents information through spatially structured reference frames, and both estimates and is able to effect movement in the world. Learning is a quick, associative process, similar to Hebbian learning in the brain, and leverages inductive biases around the spatial structure of the world to enable rapid and continual learning. Multiple learning modules can interact with one another both hierarchically and non-hierarchically via a "cortical messaging protocol" (CMP), creating more abstract representations and supporting multimodal integration. We outline the key principles motivating the design of thousand-brains systems and provide details about the implementation of Monty, our first instantiation of such a system. Code can be found at https://github.com/thousandbrainsproject/tbp.monty, along with more detailed documentation at https://thousandbrainsproject.readme.io/.