Structured Latent Dynamics in Wireless CSI via Homomorphic World Models

📄 arXiv: 2603.20048v1 📥 PDF

作者: Salmane Naoumi, Mehdi Bennis, Marwa Chafii

分类: eess.SP, cs.LG

发布日期: 2026-03-20

备注: ACCEPTED FOR PUBLICATION IN IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC) 2026


💡 一句话要点

提出基于同态世界模型的无线CSI结构化潜在动态学习框架

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知与语义 (Perception & Semantics) 支柱五:交互与反应 (Interaction & Reaction) 支柱七:动作重定向 (Motion Retargeting)

关键词: 无线信道建模 信道状态信息 自监督学习 世界模型 李代数

📋 核心要点

  1. 现有方法难以有效建模无线信道状态信息(CSI)的时序演化,缺乏对空间布局和用户运动的结构化理解。
  2. 论文提出基于同态世界模型的自监督学习框架,利用JEPA学习CSI轨迹的动作条件潜在动态,并使用李代数保证几何一致性。
  3. 实验表明,该方法在拓扑保持和未来嵌入预测方面优于现有方法,并能生成度量保真信道图。

📝 摘要(中文)

本文提出了一种自监督框架,用于学习无线信道的预测性和结构化表示。该框架通过在紧凑的潜在空间中建模信道状态信息(CSI)的时间演化来实现。该方法将问题转化为世界建模任务,并利用联合嵌入预测架构(JEPA)从CSI轨迹中学习动作条件下的潜在动态。为了促进几何一致性和可组合性,我们使用源自李代数的同态更新来参数化转换,从而产生一个反映空间布局和用户运动的结构化潜在空间。在DICHASUS数据集上的评估表明,我们的方法在保持拓扑结构和预测跨未见环境的未来嵌入方面优于强大的基线。由此产生的潜在空间能够实现度量保真信道图,为移动感知调度、定位和无线场景理解等下游应用提供可扩展的基础。

🔬 方法详解

问题定义:现有无线信道建模方法难以捕捉CSI的时序动态和内在结构,无法有效利用CSI进行预测和下游任务。传统方法通常依赖于复杂的信道模型或简单的统计特征,难以适应复杂多变的无线环境。此外,缺乏对空间布局和用户运动的显式建模,限制了模型的可解释性和泛化能力。

核心思路:论文的核心思路是将无线信道建模问题转化为一个世界建模任务,通过学习CSI轨迹的潜在动态来预测未来的信道状态。关键在于利用自监督学习方法,从原始CSI数据中提取有意义的潜在表示,并学习这些表示之间的转换关系。通过引入同态更新,保证潜在空间的几何一致性,从而更好地反映空间布局和用户运动。

技术框架:整体框架包括三个主要模块:编码器、动态模型和解码器。编码器将原始CSI数据映射到潜在空间,动态模型学习潜在表示之间的转换关系,解码器将潜在表示映射回CSI空间。JEPA架构用于学习潜在表示,并利用对比学习损失来提高表示的质量。同态更新模块基于李代数,用于参数化动态模型的转换,保证潜在空间的几何一致性。

关键创新:最重要的创新点在于利用同态更新来参数化潜在空间的动态模型。与传统的神经网络相比,同态更新能够更好地保持潜在空间的几何结构,从而更好地反映空间布局和用户运动。此外,将无线信道建模问题转化为世界建模任务,为利用自监督学习方法提供了新的思路。

关键设计:动态模型使用基于李代数的同态更新,具体而言,使用李群元素来表示潜在空间的转换,并利用李代数来计算这些转换的导数。损失函数包括重构损失和对比学习损失,重构损失用于保证解码器能够准确地将潜在表示映射回CSI空间,对比学习损失用于提高潜在表示的质量。网络结构采用Transformer架构,用于捕捉CSI的时序依赖关系。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在DICHASUS数据集上的实验结果表明,该方法在拓扑保持和未来嵌入预测方面优于现有的基线方法。具体而言,该方法能够显著降低预测误差,并能够生成更准确的信道图。与传统的基于神经网络的方法相比,该方法能够更好地保持潜在空间的几何结构,从而更好地反映空间布局和用户运动。

🎯 应用场景

该研究成果可应用于多种无线通信场景,例如移动感知调度、无线定位和无线场景理解。通过预测未来的信道状态,可以实现更高效的资源分配和干扰管理。利用结构化的潜在空间,可以实现更精确的定位和场景识别。此外,该方法还可以用于构建更智能的无线网络,能够根据环境变化自适应地调整参数。

📄 摘要(原文)

We introduce a self-supervised framework for learning predictive and structured representations of wireless channels by modeling the temporal evolution of channel state information (CSI) in a compact latent space. Our method casts the problem as a world modeling task and leverages the Joint Embedding Predictive Architecture (JEPA) to learn action-conditioned latent dynamics from CSI trajectories. To promote geometric consistency and compositionality, we parameterize transitions using homomorphic updates derived from Lie algebra, yielding a structured latent space that reflects spatial layout and user motion. Evaluations on the DICHASUS dataset show that our approach outperforms strong baselines in preserving topology and forecasting future embeddings across unseen environments. The resulting latent space enables metrically faithful channel charts, offering a scalable foundation for downstream applications such as mobility-aware scheduling, localization, and wireless scene understanding.