PSI: Shared State as the Missing Layer for Coherent AI-Generated Instruments in Personal AI Agents

📄 arXiv: 2604.08529v1 📥 PDF

作者: Zhiyuan Wang, Erzhen Hu, Mark Rucker, Laura E. Barnes

分类: cs.HC, cs.AI

发布日期: 2026-04-09


💡 一句话要点

PSI:共享状态作为个人AI Agent中连贯AI生成工具的关键层

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 共享状态 个人AI Agent AI生成工具 模块化架构 协同计算

📋 核心要点

  1. 现有个人AI工具生成后通常孤立,缺乏协同和统一管理。
  2. PSI通过共享状态架构连接独立生成的AI模块,实现跨模块推理和同步操作。
  3. 通过自传式部署验证,PSI能自动集成后续生成的工具,形成连贯的个人计算环境。

📝 摘要(中文)

个人AI工具现在可以通过自然语言请求生成,但它们在创建后通常是孤立的。我们提出了PSI,一种共享状态架构,它将独立生成的模块转变为连贯的工具:持久的、连接的、并且与聊天互补的组件,可以通过GUI和通用聊天代理访问。通过将当前状态和写回功能发布到共享的个人上下文总线,模块能够实现跨模块推理和跨接口的同步操作。我们通过在一个自开发的个人AI环境中进行为期三周的自传式部署来研究PSI,并表明后来生成的工具可以通过相同的协议自动集成。PSI将共享状态识别为缺失的系统层,该层将AI生成的个人软件从孤立的应用程序转变为连贯的个人计算环境。

🔬 方法详解

问题定义:现有个人AI工具虽然可以根据自然语言请求生成,但它们之间通常是孤立的,无法进行有效的协同工作。这导致用户需要手动管理和协调多个工具,降低了效率和用户体验。现有方法缺乏一个统一的框架来连接和管理这些独立的AI模块。

核心思路:PSI的核心思路是引入一个共享状态层,作为连接各个独立AI模块的桥梁。通过将模块的状态信息发布到这个共享层,其他模块可以访问和利用这些信息,从而实现跨模块的推理和协同。这种设计使得各个模块不再是孤立的个体,而是可以相互协作,共同完成复杂的任务。

技术框架:PSI的技术框架主要包括三个部分:独立的AI模块、共享状态总线和用户界面(包括GUI和聊天代理)。每个AI模块负责执行特定的任务,并将自己的状态信息发布到共享状态总线上。其他模块可以订阅总线上的信息,并根据需要进行推理和操作。用户可以通过GUI或聊天代理与系统进行交互,并触发相应的模块执行任务。

关键创新:PSI最重要的技术创新点在于提出了共享状态作为连接独立AI模块的关键层。与传统的孤立式设计相比,PSI能够实现跨模块的推理和协同,从而提高系统的整体性能和用户体验。此外,PSI还支持自动集成后续生成的工具,使得系统具有良好的可扩展性。

关键设计:PSI的关键设计包括共享状态总线的实现方式、模块间通信协议以及状态信息的表示方法。共享状态总线可以使用消息队列、数据库或其他分布式存储系统来实现。模块间通信协议需要定义清晰的数据格式和交互流程,以确保模块之间的有效通信。状态信息的表示方法需要能够准确地描述模块的当前状态,并支持其他模块进行推理和操作。具体的技术细节(如参数设置、损失函数、网络结构等)未在摘要中提及,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该研究通过为期三周的自传式部署验证了PSI架构的有效性。实验结果表明,PSI能够自动集成后续生成的工具,并实现跨模块的协同工作。具体的性能数据和提升幅度未在摘要中提及,属于未知信息。该实验证明了共享状态是连接独立AI模块的关键。

🎯 应用场景

PSI架构可应用于构建智能家居、个人助理、自动化办公等领域。通过连接各种AI工具和服务,PSI能够实现更智能、更个性化的用户体验,例如根据用户日程自动调整家居环境、根据用户偏好推荐信息等。未来,PSI有望成为个人AI计算环境的基础设施。

📄 摘要(原文)

Personal AI tools can now be generated from natural-language requests, but they often remain isolated after creation. We present PSI, a shared-state architecture that turns independently generated modules into coherent instruments: persistent, connected, and chat-complementary artifacts accessible through both GUIs and a generic chat agent. By publishing current state and write-back affordances to a shared personal-context bus, modules enable cross-module reasoning and synchronized actions across interfaces. We study PSI through a three-week autobiographical deployment in a self-developed personal AI environment and show that later-generated instruments can be integrated automatically through the same contract. PSI identifies shared state as the missing systems layer that transforms AI-generated personal software from isolated apps into coherent personal computing environments.