Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

📄 arXiv: 2604.22085v1 📥 PDF

作者: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani

分类: cs.AI

发布日期: 2026-04-23

备注: 13 Pages, 10 Tables, 8 Figures


💡 一句话要点

Memanto:面向长时程Agent的类型化语义记忆与信息论检索

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 语义记忆 长时程Agent 信息论检索 知识图谱 Agent人工智能

📋 核心要点

  1. 现有Agent系统依赖混合语义图架构,导致摄取和检索过程计算开销巨大,需要大型语言模型进行实体提取和复杂的查询流程。
  2. Memanto提出一种通用记忆层,包含类型化语义记忆模式、自动冲突解决机制和时间版本控制,并使用信息论搜索引擎实现快速检索。
  3. 实验表明,Memanto在LongMemEval和LoCoMo上取得了SOTA的准确率,超越了现有混合图和向量系统,且无需索引和摄取成本。

📝 摘要(中文)

本文提出Memanto,一种用于Agent人工智能的通用记忆层,旨在挑战知识图谱复杂性对于实现高保真Agent记忆的必要性假设。Memanto集成了类型化的语义记忆模式(包含13个预定义记忆类别)、自动冲突解决机制和时间版本控制。这些组件由Moorcheh的信息论搜索引擎驱动,该引擎是一种无需索引的语义数据库,可在低于90毫秒的延迟内提供确定性检索,同时消除摄取延迟。在LongMemEval和LoCoMo评估套件上的系统基准测试表明,Memanto实现了最先进的准确率,分别为89.8%和87.1%。这些结果超过了所有评估的混合图和基于向量的系统,同时仅需要单个检索查询,不产生摄取成本,并保持显著较低的运营复杂性。通过一个五阶段的渐进式消融研究,量化了每个架构组件的贡献,并讨论了对Agent记忆系统可扩展部署的影响。

🔬 方法详解

问题定义:现有Agent系统在部署时面临记忆瓶颈,主要体现在计算开销大的混合语义图架构上。这些架构需要复杂的实体提取、图模式维护和多查询检索流程,导致效率低下,难以满足实际应用需求。现有方法的痛点在于高昂的摄取和检索成本,以及复杂的系统维护。

核心思路:Memanto的核心思路是利用类型化的语义记忆模式和信息论搜索引擎,构建一个高效、低成本的Agent记忆系统。通过预定义记忆类别和自动冲突解决机制,简化了知识表示和管理。信息论搜索引擎则实现了快速、确定性的检索,避免了传统索引带来的延迟。

技术框架:Memanto的整体架构包含三个主要组件:类型化语义记忆模式、自动冲突解决机制和时间版本控制。类型化语义记忆模式定义了13个预定义的记忆类别,用于组织和存储信息。自动冲突解决机制用于处理不同来源或时间的信息冲突,保证记忆的一致性。时间版本控制则记录了记忆的历史变化,支持追溯和回滚。这些组件由Moorcheh的信息论搜索引擎驱动,提供快速检索。

关键创新:Memanto最重要的技术创新在于其无需索引的语义检索方法。传统语义记忆系统依赖索引来加速检索,但索引的构建和维护会带来额外的开销。Memanto通过信息论搜索引擎,直接在原始数据上进行语义检索,避免了索引的需要,从而降低了摄取成本和延迟。此外,类型化的语义记忆模式也简化了知识表示,降低了系统复杂性。

关键设计:Memanto的关键设计包括13个预定义的记忆类别,这些类别涵盖了Agent可能需要记忆的各种信息类型。自动冲突解决机制采用了一系列规则和策略,用于判断和解决信息冲突。时间版本控制则通过记录每次记忆更新的时间戳和内容,实现了记忆的历史追溯。Moorcheh的信息论搜索引擎的具体实现细节未知,但其核心思想是利用信息论原理,在原始数据上进行高效的语义检索。

📊 实验亮点

Memanto在LongMemEval和LoCoMo评估套件上取得了显著的性能提升,准确率分别达到89.8%和87.1%,超越了所有评估的混合图和基于向量的系统。更重要的是,Memanto仅需要单个检索查询,不产生摄取成本,并保持显著较低的运营复杂性。消融研究表明,类型化语义记忆模式、自动冲突解决机制和时间版本控制都对性能提升做出了贡献。

🎯 应用场景

Memanto可应用于各种需要长时程记忆的Agent系统中,例如智能助手、对话系统、机器人等。它可以帮助Agent记住用户的偏好、历史交互和环境信息,从而提供更个性化、更智能的服务。Memanto的低成本和高效率使其能够部署在资源受限的设备上,例如移动设备和嵌入式系统。未来,Memanto有望成为Agent人工智能的基础设施,推动Agent技术的广泛应用。

📄 摘要(原文)

The transition from stateless language model inference to persistent, multi session autonomous agents has revealed memory to be a primary architectural bottleneck in the deployment of production grade agentic systems. Existing methodologies largely depend on hybrid semantic graph architectures, which impose substantial computational overhead during both ingestion and retrieval. These systems typically require large language model mediated entity extraction, explicit graph schema maintenance, and multi query retrieval pipelines. This paper introduces Memanto, a universal memory layer for agentic artificial intelligence that challenges the prevailing assumption that knowledge graph complexity is necessary to achieve high fidelity agent memory. Memanto integrates a typed semantic memory schema comprising thirteen predefined memory categories, an automated conflict resolution mechanism, and temporal versioning. These components are enabled by Moorcheh's Information Theoretic Search engine, a no indexing semantic database that provides deterministic retrieval within sub ninety millisecond latency while eliminating ingestion delay. Through systematic benchmarking on the LongMemEval and LoCoMo evaluation suites, Memanto achieves state of the art accuracy scores of 89.8 percent and 87.1 percent respectively. These results surpass all evaluated hybrid graph and vector based systems while requiring only a single retrieval query, incurring no ingestion cost, and maintaining substantially lower operational complexity. A five stage progressive ablation study is presented to quantify the contribution of each architectural component, followed by a discussion of the implications for scalable deployment of agentic memory systems.