Whole-Brain Connectomic Graph Model Enables Whole-Body Locomotion Control in Fruit Fly

📄 arXiv: 2602.17997v1 📥 PDF

作者: Zehao Jin, Yaoye Zhu, Chen Zhang, Yanan Sui

分类: cs.LG, cs.RO

发布日期: 2026-02-20


💡 一句话要点

提出FlyGM:基于果蝇全脑连接组图模型的具身运动控制方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 全脑连接组 图神经网络 具身强化学习 果蝇 运动控制

📋 核心要点

  1. 现有方法难以利用全脑连接组进行具身强化学习,缺乏生物学合理的信息流动机制。
  2. 提出FlyGM,其静态结构与果蝇全脑连接组相同,通过有向消息传递实现生物学信息流动。
  3. 实验表明,FlyGM在多种运动任务中表现出更高的样本效率和更优的性能,验证了连接组的结构优势。

📝 摘要(中文)

本文探索了将大脑连接组作为具身强化学习中神经⽹络控制器的应用。我们研究了使用成年果蝇大脑的精确神经结构来控制其身体运动。我们开发了Fly-connectomic Graph Model (FlyGM),其静态结构与成年果蝇的完整连接组相同,用于全身运动控制。为了执行动态控制,FlyGM将静态连接组表示为有向消息传递图,从而实现了从感觉输入到运动输出的生物学信息流。与生物力学果蝇模型集成后,我们的方法无需针对特定任务进行架构调整即可在各种运动任务中实现稳定控制。为了验证基于连接组模型的结构优势,我们将其与保留度重连图、随机图和多层感知器进行了比较,结果表明FlyGM具有更高的样本效率和卓越的性能。这项工作表明,静态大脑连接组可以被转换为实例化有效的神经策略,用于运动控制的具身学习。

🔬 方法详解

问题定义:现有方法在具身强化学习中,难以有效利用生物大脑的全脑连接组信息。传统的神经网络结构缺乏生物学上的合理性,难以模拟大脑中复杂的信息流动模式,导致控制性能受限,样本效率低下。因此,如何将全脑连接组的结构信息融入到控制策略中,是本文要解决的关键问题。

核心思路:本文的核心思路是将果蝇的全脑连接组直接作为神经网络的结构,构建一个图神经网络,称为FlyGM。通过将静态的连接组转化为有向消息传递图,模拟生物大脑中神经元之间的信息传递过程。这种方法能够充分利用连接组的结构信息,实现从感觉输入到运动输出的生物学信息流动,从而提高控制性能和样本效率。

技术框架:FlyGM的整体框架包括以下几个主要部分:1) 果蝇全脑连接组数据:使用已知的果蝇全脑连接组数据作为FlyGM的静态结构。2) 图神经网络构建:将连接组转化为有向图,其中节点代表神经元,边代表神经元之间的连接。3) 消息传递机制:采用消息传递算法,模拟神经元之间的信息传递过程。4) 生物力学果蝇模型:将FlyGM与一个生物力学果蝇模型集成,用于模拟果蝇的运动。5) 强化学习训练:使用强化学习算法训练FlyGM,使其能够控制果蝇的运动。

关键创新:本文最重要的技术创新点在于直接利用全脑连接组作为神经网络的结构。与传统的神经网络结构相比,FlyGM具有更强的生物学合理性,能够更好地模拟大脑中的信息流动模式。此外,FlyGM无需针对特定任务进行架构调整,具有更强的通用性和适应性。

关键设计:FlyGM的关键设计包括:1) 连接组的图表示:将连接组表示为有向图,其中节点代表神经元,边代表神经元之间的连接强度。2) 消息传递函数:使用特定的消息传递函数,模拟神经元之间的信息传递过程。3) 强化学习算法:选择合适的强化学习算法,如PPO或SAC,训练FlyGM。4) 奖励函数设计:设计合理的奖励函数,引导FlyGM学习期望的运动行为。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,FlyGM在多种运动任务中表现出优异的性能。与度保持重连图、随机图和多层感知器相比,FlyGM具有更高的样本效率和更优的控制性能。例如,在特定运动任务中,FlyGM的样本效率提高了20%以上,表明了连接组结构在运动控制中的重要作用。

🎯 应用场景

该研究成果可应用于生物机器人控制、神经形态计算和人工智能等领域。通过模拟生物大脑的结构和功能,可以开发出更智能、更高效的机器人控制系统。此外,该研究还有助于深入理解大脑的工作机制,为神经科学研究提供新的思路和方法。未来,该方法有望应用于更复杂的生物系统,实现更高级的智能控制。

📄 摘要(原文)

Whole-brain biological neural networks naturally support the learning and control of whole-body movements. However, the use of brain connectomes as neural network controllers in embodied reinforcement learning remains unexplored. We investigate using the exact neural architecture of an adult fruit fly's brain for the control of its body movement. We develop Fly-connectomic Graph Model (FlyGM), whose static structure is identical to the complete connectome of an adult Drosophila for whole-body locomotion control. To perform dynamical control, FlyGM represents the static connectome as a directed message-passing graph to impose a biologically grounded information flow from sensory inputs to motor outputs. Integrated with a biomechanical fruit fly model, our method achieves stable control across diverse locomotion tasks without task-specific architectural tuning. To verify the structural advantages of the connectome-based model, we compare it against a degree-preserving rewired graph, a random graph, and multilayer perceptrons, showing that FlyGM yields higher sample efficiency and superior performance. This work demonstrates that static brain connectomes can be transformed to instantiate effective neural policy for embodied learning of movement control.