Symbolic-Vector Attention Fusion for Collective Intelligence

作者: Hongwei Xu

分类: cs.MA, cs.AI

发布日期: 2026-04-07

💡 一句话要点

提出符号-向量注意力融合（SVAF）机制，用于提升集体智能中跨智能体的信息融合效果。

🎯 匹配领域: 支柱七：动作重定向 (Motion Retargeting) 支柱八：物理动画 (Physics-based Animation)

关键词: 集体智能 注意力机制 信息融合 多智能体系统 语义理解

📋 核心要点

现有方法在处理多智能体协作时，难以有效区分和利用不同智能体间信号的相关维度，导致信息融合效率低下。
论文提出SVAF机制，通过分解信号为语义字段并使用注意力机制进行评估和重组，实现跨领域知识的有效融合。
实验表明，SVAF在叙事场景中实现了78.7%的三类准确率，并在实时部署中验证了其在多平台上的有效性。

📝 摘要（中文）

当自主智能体观察共享环境的不同领域时，它们交换的每个信号都混合了相关和不相关的维度。目前没有机制可以让接收者评估吸收哪些维度。我们引入了符号-向量注意力融合（SVAF），这是集体智能双层耦合引擎的内容评估部分。SVAF将每个智能体间的信号分解为7个类型的语义字段，通过学习到的融合门评估每个字段，并产生一个重组——来自两个领域交叉的新知识。一个带通模型产生四个结果（冗余、对齐、保护、拒绝），解决了选择性和冗余性问题。融合门独立地发现了一个跨域相关性层次：情绪在epoch 1时成为权重最高的字段，在准确率达到稳定之前——这与独立的机制证据一致，即LLM的情感表征在结构上沿着效价-唤醒轴嵌入。SVAF构成网格记忆协议（MMP）的第4层；耦合引擎的另一半是第6层上的每个智能体的闭式连续时间（CfC）神经网络，其学习到的每个神经元的时间常数（tau）创造了集体智能涌现的时间动态：快速神经元在几秒钟内同步智能体之间的情感，而慢速神经元无限期地保持领域专业知识。SVAF决定了什么进入每个智能体的认知状态；CfC决定了该状态如何演变。在来自273个叙事场景的237K个样本上训练，SVAF实现了78.7%的三类准确率。我们验证了完整的网格认知循环——从每个字段的评估到重组，CfC状态演变，tau调制的对等融合，以及自主行动——在一个跨macOS、iOS和web的7个节点的实时部署中。

🔬 方法详解

问题定义：在多智能体系统中，每个智能体观察到的环境信息可能存在差异，智能体之间需要交换信息以进行协作。然而，交换的信息中既包含有用的信息，也包含冗余或无关的信息。现有方法缺乏有效机制来区分和选择性地利用这些信息，导致信息融合效率低下，影响整体的集体智能水平。

核心思路：论文的核心思路是将智能体间交换的信号分解为多个语义字段，并使用注意力机制来评估每个字段的重要性。通过学习到的融合门，选择性地吸收相关字段，并拒绝不相关字段，从而实现跨领域知识的有效融合。这种方法模拟了人类在接收信息时进行选择性注意的过程。

技术框架：SVAF是网格记忆协议（MMP）的第4层，与第6层的闭式连续时间（CfC）神经网络共同构成一个双层耦合引擎。整体流程如下：1) 将智能体间信号分解为7个类型的语义字段；2) 使用学习到的融合门评估每个字段；3) 根据评估结果重组信息，产生新的知识；4) CfC神经网络根据接收到的信息更新智能体的认知状态；5) 通过tau调制的对等融合，实现智能体间的协作；6) 智能体根据认知状态采取行动。

关键创新：SVAF的关键创新在于其符号-向量注意力融合机制。它将传统的注意力机制应用于语义字段，使得智能体能够根据上下文选择性地关注不同的信息维度。此外，带通模型能够区分冗余、对齐、保护和拒绝四种信息类型，从而更有效地管理信息流。

关键设计：SVAF将每个智能体间的信号分解为7个类型的语义字段（具体字段类型未知）。融合门是一个可学习的神经网络，用于评估每个字段的重要性。带通模型根据融合门的输出，将信息分为四类：冗余、对齐、保护和拒绝。CfC神经网络使用学习到的每个神经元的时间常数（tau）来控制信息的时间动态。

📊 实验亮点

实验结果表明，SVAF在237K个叙事场景样本上实现了78.7%的三类准确率。此外，实时部署验证了SVAF在跨平台环境下的有效性，证明了其在实际应用中的潜力。研究还发现，情绪在信息融合中扮演重要角色，这与LLM情感表征的研究结果相符。

🎯 应用场景

该研究成果可应用于多智能体协作机器人、智能交通系统、分布式传感器网络等领域。通过提升智能体间的信息融合效率，可以提高系统的整体性能和鲁棒性，实现更高效、更智能的协作。

📄 摘要（原文）

When autonomous agents observe different domains of a shared environment, each signal they exchange mixes relevant and irrelevant dimensions. No existing mechanism lets the receiver evaluate which dimensions to absorb. We introduce Symbolic-Vector Attention Fusion (SVAF), the content-evaluation half of a two-level coupling engine for collective intelligence. SVAF decomposes each inter-agent signal into 7 typed semantic fields, evaluates each through a learned fusion gate, and produces a remix -- new knowledge from the intersection of two domains. A band-pass model yields four outcomes (redundant, aligned, guarded, rejected), solving both selectivity and redundancy. The fusion gate independently discovers a cross-domain relevance hierarchy: mood emerges as the highest-weight field by epoch 1, before accuracy plateaus -- consistent with independent mechanistic evidence that LLM emotion representations are structurally embedded along valence-arousal axes. SVAF forms Layer 4 of the Mesh Memory Protocol (MMP); the other half of the coupling engine is a per-agent Closed-form Continuous-time (CfC) neural network at Layer 6, whose learned per-neuron time constants (tau) create the temporal dynamics from which collective intelligence emerges: fast neurons synchronise affect across agents in seconds, while slow neurons preserve domain expertise indefinitely. SVAF determines what enters each agent's cognitive state; CfC determines how that state evolves. Trained on 237K samples from 273 narrative scenarios, SVAF achieves 78.7% three-class accuracy. We verify the complete mesh cognition loop -- from per-field evaluation through remix, CfC state evolution, tau-modulated peer blending, and autonomous action -- in a live deployment with 7 nodes across macOS, iOS, and web.

Symbolic-Vector Attention Fusion for Collective Intelligence

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理