A Novel Riemannian Sparse Representation Learning Network for Polarimetric SAR Image Classification

📄 arXiv: 2502.15302v1 📥 PDF

作者: Junfei Shi, Mengmeng Nie, Weisi Lin, Haiyan Jin, Junhuai Li, Rui Wang

分类: cs.CV

发布日期: 2025-02-21

备注: 13 pages, 9 figures


💡 一句话要点

提出一种黎曼稀疏表示学习网络,用于极化SAR图像分类,提升边缘细节和区域同质性。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 极化SAR图像分类 黎曼流形 稀疏表示 深度学习 卷积神经网络

📋 核心要点

  1. 现有PolSAR图像分类深度学习方法缺乏数学原理指导,且在欧几里得空间学习特征,忽略了PolSAR数据的黎曼流形特性。
  2. 提出黎曼稀疏表示学习网络(SRSR CNN),利用黎曼度量学习复协方差矩阵的几何结构和稀疏特征,并结合CNN提取高级上下文特征。
  3. 在三个真实PolSAR数据集上验证,结果表明该方法在边缘细节和区域同质性方面优于现有技术,提升了分类精度。

📝 摘要(中文)

深度学习是极化合成孔径雷达(PolSAR)图像分类的有效端到端方法,但缺乏相关数学原理的指导,本质上是一个黑盒模型。此外,现有的深度模型在欧几里得空间中学习特征,通常将PolSAR复矩阵转换为复值向量作为网络输入,扭曲了矩阵结构和通道关系。然而,复协方差矩阵是Hermitian正定(HPD)的,位于黎曼流形上而不是欧几里得空间。现有方法无法测量HPD矩阵的几何距离,并且容易因不适当的欧几里得度量而导致一些错误分类。为了解决这些问题,我们提出了一种新的黎曼稀疏表示学习网络(SRSR CNN)用于PolSAR图像。首先,设计了一种基于超像素的黎曼稀疏表示(SRSR)模型,以学习具有黎曼度量的稀疏特征。然后,推断SRSR模型的优化过程,并进一步展开为SRSRnet,它可以自动学习稀疏系数和字典原子。此外,为了学习上下文高级特征,添加了一个CNN增强模块以提高分类性能。所提出的网络是一种稀疏表示(SR)引导的深度学习模型,可以直接利用协方差矩阵作为网络输入,并利用黎曼度量来学习黎曼空间中复矩阵的几何结构和稀疏特征。在三个真实PolSAR数据集上的实验表明,所提出的方法在确保精确的边缘细节和正确的区域同质性方面优于最先进的技术。

🔬 方法详解

问题定义:现有的PolSAR图像分类方法,特别是基于深度学习的方法,通常将复协方差矩阵转换为复值向量,并在欧几里得空间中进行特征学习,这忽略了PolSAR数据固有的黎曼流形结构。此外,这些方法缺乏明确的数学原理指导,导致模型的可解释性较差,且容易因不适当的距离度量而产生分类错误。因此,如何有效地利用PolSAR数据的黎曼几何特性,并将其融入到深度学习框架中,是一个亟待解决的问题。

核心思路:论文的核心思路是利用黎曼流形上的稀疏表示来学习PolSAR数据的特征。由于PolSAR数据的复协方差矩阵是Hermitian正定的,因此它们自然地位于黎曼流形上。通过在黎曼流形上定义稀疏表示模型,可以更好地捕捉数据的几何结构和内在关系。此外,论文还将稀疏表示模型的优化过程展开为一个深度网络,从而实现端到端的学习,并结合CNN提取上下文信息,进一步提升分类性能。

技术框架:该方法主要包含以下几个模块:1) 基于超像素的黎曼稀疏表示(SRSR)模型:该模型在黎曼流形上定义稀疏表示,利用黎曼度量来计算数据点之间的距离。2) SRSRnet:通过将SRSR模型的优化过程展开为一个深度网络,实现稀疏系数和字典原子的自动学习。3) CNN增强模块:利用卷积神经网络提取上下文高级特征,进一步提升分类性能。整体流程是:首先利用超像素分割图像,然后将每个超像素的协方差矩阵输入到SRSRnet中学习稀疏表示,最后将SRSRnet的输出和CNN增强模块的输出进行融合,得到最终的分类结果。

关键创新:该方法最重要的创新点在于将黎曼稀疏表示与深度学习相结合,提出了一种新的黎曼稀疏表示学习网络(SRSR CNN)。与现有方法相比,该方法可以直接利用协方差矩阵作为网络输入,并在黎曼流形上学习特征,从而更好地捕捉数据的几何结构和内在关系。此外,通过将稀疏表示模型的优化过程展开为一个深度网络,实现了端到端的学习,避免了传统稀疏表示方法中需要手动设计特征的缺点。

关键设计:在SRSR模型中,使用了黎曼度量来计算数据点之间的距离,例如Log-Euclidean度量或Affine-Invariant Riemannian Metric (AIRM)。SRSRnet的网络结构是根据SRSR模型的优化过程推导出来的,每一层对应于优化过程中的一个迭代步骤。CNN增强模块可以使用各种经典的CNN结构,例如ResNet或DenseNet。损失函数通常包括分类损失和稀疏性约束项,用于保证学习到的特征具有判别性和稀疏性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的SRSR CNN在三个真实PolSAR数据集上均取得了优于现有技术的分类性能。具体而言,该方法在保证精确的边缘细节和正确的区域同质性方面表现出色,能够有效减少分类错误,并提升整体分类精度。与传统方法和现有深度学习方法相比,该方法在分类精度上取得了显著提升。

🎯 应用场景

该研究成果可应用于遥感图像分析、目标检测与识别、地物分类等领域。尤其在极化SAR图像处理方面,能够提升农作物监测、城市规划、灾害评估等应用的精度和可靠性,具有重要的实际应用价值和广阔的应用前景。

📄 摘要(原文)

Deep learning is an effective end-to-end method for Polarimetric Synthetic Aperture Radar(PolSAR) image classification, but it lacks the guidance of related mathematical principle and is essentially a black-box model. In addition, existing deep models learn features in Euclidean space, where PolSAR complex matrix is commonly converted into a complex-valued vector as the network input, distorting matrix structure and channel relationship. However, the complex covariance matrix is Hermitian positive definite (HPD), and resides on a Riemannian manifold instead of a Euclidean one. Existing methods cannot measure the geometric distance of HPD matrices and easily cause some misclassifications due to inappropriate Euclidean measures. To address these issues, we propose a novel Riemannian Sparse Representation Learning Network (SRSR CNN) for PolSAR images. Firstly, a superpixel-based Riemannian Sparse Representation (SRSR) model is designed to learn the sparse features with Riemannian metric. Then, the optimization procedure of the SRSR model is inferred and further unfolded into an SRSRnet, which can automatically learn the sparse coefficients and dictionary atoms. Furthermore, to learn contextual high-level features, a CNN-enhanced module is added to improve classification performance. The proposed network is a Sparse Representation (SR) guided deep learning model, which can directly utilize the covariance matrix as the network input, and utilize Riemannian metric to learn geometric structure and sparse features of complex matrices in Riemannian space. Experiments on three real PolSAR datasets demonstrate that the proposed method surpasses state-of-the-art techniques in ensuring accurate edge details and correct region homogeneity for classification.