Efficient Transceiver Design for Aerial Image Transmission and Large-scale Scene Reconstruction
作者: Zeyi Ren, Jialin Dong, Wei Zuo, Yikun Wang, Bingyang Cheng, Sheng Zhou, Zhisheng Niu
分类: cs.CV, cs.LG, eess.SP
发布日期: 2026-04-13
备注: 6 pages, 6 figures, submitted to IEEE ISIT-w
💡 一句话要点
提出基于3DGS的端到端通信方案,用于提升无人机图像传输效率和大规模场景重建质量。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 无人机图像传输 3D场景重建 端到端学习 低空智能网络 3D高斯溅射
📋 核心要点
- 现有方案难以平衡严重的导频开销与重建保真度所需的传输精度,这是低空智能网络中大规模3D场景重建面临的核心问题。
- 论文提出一种端到端收发器设计,将3D高斯溅射融入训练,通过联合优化通信模块和渲染损失来提升场景重建质量。
- 实验表明,该方法优于现有基线,在降低传输开销的同时,实现了更优的传输性能和更精确的3D场景重建。
📝 摘要(中文)
本文提出了一种基于深度学习的端到端(E2E)收发器设计,用于低空智能网络(LAIN)中的大规模三维(3D)场景重建,旨在提高无线图像传输效率。该方法将3D高斯溅射(3DGS)直接集成到训练过程中,通过联合优化通信模块和3DGS渲染损失,显式地提升场景重建质量。此外,这种任务驱动的框架能够使用稀疏导频方案,显著降低传输开销,同时在低空信道条件下保持鲁棒的图像恢复。在真实航拍图像数据集上的大量实验表明,所提出的E2E设计明显优于现有基线,提供了卓越的传输性能和精确的3D场景重建。
🔬 方法详解
问题定义:论文旨在解决低空智能网络中,无人机图像传输用于大规模3D场景重建时,现有方案在导频开销和重建精度之间难以平衡的问题。传统方法需要大量的导频信号来保证信道估计的准确性,从而实现可靠的图像传输,但这会显著降低传输效率。此外,这些方法通常没有直接针对3D重建任务进行优化,导致传输误差会严重影响最终的重建质量。
核心思路:论文的核心思路是将3D高斯溅射(3DGS)渲染直接集成到端到端(E2E)的通信系统训练中。通过这种方式,通信模块的优化目标不再是传统的信道容量或误码率,而是最终的3D场景重建质量。这种任务驱动的设计允许系统在保证重建质量的前提下,使用更少的导频信号,从而提高传输效率。
技术框架:整体框架是一个端到端的通信系统,包括发送端和接收端。发送端负责对图像进行编码和调制,通过无线信道传输。接收端接收信号后进行解调和解码,然后使用解码后的图像进行3DGS渲染。关键在于,整个通信过程的优化目标是3DGS渲染的损失函数,即重建的场景与真实场景之间的差异。因此,发送端和接收端的网络参数都是通过最小化这个损失函数来联合训练的。
关键创新:最重要的创新点在于将3DGS渲染集成到通信系统的训练过程中,实现了任务驱动的通信系统设计。与传统的信道编码和调制方案不同,该方法直接优化通信模块以提高3D场景重建的质量。此外,这种设计使得系统可以使用稀疏导频方案,显著降低了传输开销。
关键设计:论文使用了深度学习模型来实现发送端和接收端的编码和解码功能。具体的网络结构和参数设置(例如卷积层数、滤波器大小、激活函数等)在论文中应该有详细描述(未知)。损失函数是基于3DGS渲染的,用于衡量重建场景与真实场景之间的差异。稀疏导频方案的设计也是一个关键点,需要仔细选择导频信号的位置和数量,以在保证信道估计精度的同时,最小化导频开销。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在真实航拍图像数据集上显著优于现有基线。具体性能数据(例如传输效率提升百分比、重建精度提升百分比等)未知,但摘要中明确指出该方法提供了卓越的传输性能和精确的3D场景重建。该方法通过使用稀疏导频方案,有效降低了传输开销,同时保持了鲁棒的图像恢复能力。
🎯 应用场景
该研究成果可应用于低空智能网络中的大规模3D场景重建,例如城市建模、环境监测、灾害评估和自动驾驶等领域。通过提高无人机图像传输效率和重建精度,可以降低重建成本,提升重建质量,为相关应用提供更可靠的数据支持,并促进低空智能网络的发展。
📄 摘要(原文)
Large-scale three-dimensional (3D) scene reconstruction in low-altitude intelligent networks (LAIN) demands highly efficient wireless image transmission. However, existing schemes struggle to balance severe pilot overhead with the transmission accuracy required to maintain reconstruction fidelity. To strike a balance between efficiency and reliability, this paper proposes a novel deep learning-based end-to-end (E2E) transceiver design that integrates 3D Gaussian Splatting (3DGS) directly into the training process. By jointly optimizing the communication modules via the combined 3DGS rendering loss, our approach explicitly improves scene recovery quality. Furthermore, this task-driven framework enables the use of a sparse pilot scheme, significantly reducing transmission overhead while maintaining robust image recovery under low-altitude channel conditions. Extensive experiments on real-world aerial image datasets demonstrate that the proposed E2E design significantly outperforms existing baselines, delivering superior transmission performance and accurate 3D scene reconstructions.