Not All Symbols Are Equal: Importance-Aware Constellation Design for Semantic Communication

📄 arXiv: 2605.14940v1 📥 PDF

作者: Albert Shaju, Christo Kurisummoottil Thomas, Mayukh Roy Chowdhury

分类: cs.LG, cs.AI, eess.SP

发布日期: 2026-05-14

备注: Submitted to IEEE GLOBECOM 2026. 6 pages, 8 figures


💡 一句话要点

提出语义重要性感知的星座图设计,提升语义通信系统在信道干扰下的鲁棒性。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 语义通信 星座图设计 深度强化学习 变分自编码器 语义重要性 物理层安全

📋 核心要点

  1. 现有语义通信系统将星座图设计与语义编码分离,导致关键语义信息与非关键信息在信道中受到同等程度的保护,易受干扰。
  2. 本文提出一种联合语义-物理层框架,通过语义重要性指标(SCI)评估概念的任务相关性,并据此设计语义感知的星座图。
  3. 实验结果表明,该方法显著提升了语义保护概率(SPP),在高频谱效率下接近100%,并在多个数据集上实现了高压缩比和语义质量。

📝 摘要(中文)

本文提出了一种联合语义-物理层框架,用于目标导向传输的语义通信系统。该框架包含:提取离散潜在概念的矢量量化-变分自编码器、评估概念任务相关性的语义重要性指标(SCI)以及基于瞬时信道条件动态选择传输子集的深度强化学习代理。在物理层,学习到的语义感知M-QAM星座图根据联合共现统计和SCI分数分配符号位置,突破了标准M-QAM的均匀间隔和格雷编码,后者旨在最小化平均误码率而忽略了语义内容。我们引入了语义符号脆弱性(SSV)和语义保护概率(SPP)来量化任务关键符号暴露于解码错误的程度,并证明了在源表现出非均匀语义重要性和共现统计时,任何格雷编码星座图在SCI加权SSV中都是严格次优的。仿真结果表明,所提出的星座图在4-QAM到1024-QAM的调制阶数范围内实现了接近100%的SPP,而标准星座图在高频谱效率下仅为50%,并且在MNIST、Fashion-MNIST和FSDD上实现了21:1的压缩比,语义质量高于0.9,无需修改。

🔬 方法详解

问题定义:现有语义通信系统在物理层星座图设计时,通常采用传统的均匀间隔和格雷编码的M-QAM,旨在最小化平均误码率(BER),而忽略了不同语义信息的重要性差异。这导致重要的语义信息与不重要的语义信息在信道中受到同等程度的保护,使得系统在信道干扰下容易丢失关键信息,影响通信质量。因此,需要一种能够根据语义重要性自适应调整星座图的设计方法,以提升语义通信的鲁棒性。

核心思路:本文的核心思路是联合优化语义编码和物理层星座图设计,使得重要的语义信息在星座图中具有更高的保护级别。具体来说,首先通过语义重要性指标(SCI)来评估不同语义概念的任务相关性,然后根据SCI分数和符号的共现统计信息,设计一种语义感知的M-QAM星座图。这种星座图不再采用均匀间隔和格雷编码,而是将重要的语义符号映射到更鲁棒的星座点上,从而提高其抗干扰能力。

技术框架:该框架主要包含三个模块:1) 矢量量化-变分自编码器(VQ-VAE):用于提取离散的潜在语义概念。2) 语义重要性指标(SCI):用于评估每个语义概念的任务相关性。3) 深度强化学习(DRL)代理:用于根据瞬时信道条件动态选择传输子集。在物理层,根据SCI分数和符号共现统计信息,设计语义感知的M-QAM星座图。

关键创新:该论文的关键创新在于提出了语义重要性感知的星座图设计方法。与传统的星座图设计方法不同,该方法不再追求最小化平均误码率,而是根据语义信息的重要性,自适应地调整星座图的形状,从而提高重要语义信息的保护级别。此外,论文还提出了语义符号脆弱性(SSV)和语义保护概率(SPP)等指标,用于量化语义信息的保护程度。

关键设计:在星座图设计方面,论文根据SCI分数和符号共现统计信息,使用深度学习方法学习一种非均匀的M-QAM星座图。具体来说,将SCI分数作为权重,调整星座点之间的距离,使得重要的语义符号对应的星座点之间的距离更大,从而提高其抗干扰能力。此外,论文还设计了一种基于深度强化学习的传输子集选择策略,用于根据瞬时信道条件动态选择需要传输的语义概念。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的语义感知星座图设计方法在4-QAM到1024-QAM的调制阶数范围内,实现了接近100%的语义保护概率(SPP),而标准星座图在高频谱效率下仅为50%。此外,该方法在MNIST、Fashion-MNIST和FSDD数据集上实现了21:1的压缩比,语义质量高于0.9,无需针对不同数据集进行修改,展示了良好的泛化能力。

🎯 应用场景

该研究成果可应用于各种需要高可靠性和高效率的语义通信场景,例如:物联网(IoT)设备之间的通信、自动驾驶车辆之间的信息交换、以及远程医疗等。通过保护任务关键信息,可以显著提升通信系统的性能和可靠性,降低误判风险,具有重要的实际应用价值和未来发展潜力。

📄 摘要(原文)

Semantic communication systems for goal-oriented transmission must protect task-relevant information not only through source compression but also via physical layer mapping. Existing approaches decouple constellation design and semantic encoding, exposing critical symbols to channel errors at the same rate as irrelevant ones. Contrary to this, in this paper, a joint semantic-physical layer framework is proposed, which is composed of a vector quantized-variational autoencoder that extracts discrete latent concepts, a semantic criticality indicator (SCI) that scores each concept by task relevance, and a deep reinforcement learning agent that dynamically selects the transmission subset based on instantaneous channel conditions. At the physical layer, a learned semantic-aware M -QAM constellation assigns symbol positions according to joint co-occurrence statistics and SCI scores, departing from the uniform spacing and Gray coding of standard M -QAM which minimizes average BER without regard for semantic content. We introduce a novel semantic symbol vulnerability (SSV) metric and a semantic protection probability (SPP) to quantify the exposure of task-critical symbols to decoding errors, and prove that any Gray-coded constellation is strictly suboptimal in SCI-Weighted SSV whenever the source exhibits non-uniform semantic importance and co-occurrence statistics. Simulation results demonstrate that the proposed constellation achieves near 100% SPP across modulation orders from 4-QAM to 1024-QAM versus 50% for standard constellations at high spectral efficiency, a 21:1 compression ratio with semantic quality above 0.9, generalizing across MNIST, Fashion-MNIST, and FSDD without modification.