DimMem: Dimensional Structuring for Efficient Long-Term Agent Memory
作者: Wentao Qiu, Haotian Hu, Fanyi Wang, Jinwei Kong, Yu Zhang
分类: cs.CL
发布日期: 2026-05-15
🔗 代码/项目: GITHUB
💡 一句话要点
提出DimMem以解决长效记忆的效率与准确性问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 长期记忆 维度结构化 轻量级记忆系统 信息检索 智能助手
📋 核心要点
- 现有的记忆系统在处理长期记忆时,往往面临效率与保真度的权衡,导致信息利用不充分。
- DimMem通过将记忆表示为具有显式字段的原子单元,提供了一种新的维度感知检索和更新机制。
- 在LoCoMo-10和LongMemEval-S基准测试中,DimMem的表现优于现有系统,且显著降低了查询成本。
📝 摘要(中文)
大型语言模型(LLM)代理需要长期记忆以利用过去交互的信息。然而,现有的记忆系统往往面临保真度与效率的权衡:原始对话历史成本高,而平面事实或摘要可能丢失精确回忆所需的结构。本文提出了DimMem,一个轻量级的维度记忆框架,将每个记忆表示为一个原子、类型化且自包含的单元,具有时间、地点、原因、目的和关键词等显式字段。这种表示法揭示了维度感知检索、记忆更新和选择性助手上下文回忆所需的结构,而无需在模型上下文中存储完整历史。在LoCoMo-10和LongMemEval-S上,DimMem分别实现了81.43%和78.20%的整体准确率,超越了现有的轻量级记忆系统,同时将LoCoMo每查询的令牌成本降低了24%。
🔬 方法详解
问题定义:本文旨在解决大型语言模型在长期记忆方面的效率与保真度问题。现有方法往往需要存储大量对话历史,导致高成本和低效能。
核心思路:DimMem的核心思想是将记忆结构化为原子单元,包含时间、地点、原因、目的和关键词等字段,从而实现高效的维度感知检索和更新。
技术框架:DimMem的整体架构包括记忆的结构化表示、维度感知的检索机制和记忆更新模块。每个记忆单元都独立存储,便于快速访问和更新。
关键创新:DimMem的主要创新在于其显式的维度结构化设计,使得记忆的提取和更新更加高效,避免了传统方法中存储完整历史的需求。
关键设计:在设计中,DimMem采用了特定的字段结构以支持维度感知检索,并通过精简的参数设置和损失函数优化了记忆提取过程。
📊 实验亮点
DimMem在LoCoMo-10和LongMemEval-S基准测试中分别达到了81.43%和78.20%的准确率,超越了现有轻量级记忆系统。同时,DimMem将LoCoMo每查询的令牌成本降低了24%,显示出其在效率上的显著提升。
🎯 应用场景
DimMem的研究成果在多个领域具有潜在应用价值,特别是在需要长期记忆的智能助手、对话系统和个性化推荐等场景中。通过提高记忆的效率和准确性,DimMem能够显著提升用户体验和系统性能,未来可能推动更智能的交互系统的发展。
📄 摘要(原文)
Large language model (LLM) agents require long-term memory to leverage information from past interactions. However, existing memory systems often face a fidelity--efficiency trade-off: raw dialogue histories are expensive, while flat facts or summaries may discard the structure needed for precise recall. We propose \textbf{DimMem}, a lightweight dimensional memory framework that represents each memory as an atomic, typed, and self-contained unit with explicit fields such as time, location, reason, purpose, and keywords. This representation exposes the structure needed for dimension-aware retrieval, memory update, and selective assistant-context recall without storing full histories in the model context. Across LoCoMo-10 and LongMemEval-S, DimMem achieves \textbf{81.43\%} and \textbf{78.20\%} overall accuracy, respectively, outperforming existing lightweight memory systems while reducing LoCoMo per-query token cost by \textbf{24\%}. We further show that dimensional memory extraction is learnable by compact models: after fine-tuning on the DimMem schema, a Qwen3-4B extractor surpasses LightMem with GPT-4.1-mini on both benchmarks and reaches performance comparable to, or better than, much larger extractors in key settings. These results suggest that explicit dimensional structuring is an effective and efficient foundation for long-term memory in LLM agents. Code is available at https://github.com/ChowRunFa/DimMem.