Ultra-High-Definition Image Quality Assessment via Graph Representation Learning
作者: Shaode Yu, Enqi Chen, Ming Huang, Xuemin Ren, Songnan Zhao, Zhicheng Zhang, Qiurui Sun
分类: cs.CV
发布日期: 2026-05-21
💡 一句话要点
提出基于图表示学习的UHD-GCN-BIQA模型,提升超高清图像质量评估性能
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 超高清图像质量评估 图表示学习 图卷积网络 盲图像质量评估 上下文建模
📋 核心要点
- 现有UHD图像质量评估方法在原生分辨率下计算量大,而缩放或裁剪可能抑制尺度敏感的失真,并削弱局部伪影与全局场景上下文之间的关系。
- 本文提出UHD-GCN-BIQA框架,通过图表示学习显式建模图像区域间的结构依赖,利用图卷积网络进行上下文信息传播。
- 实验结果表明,UHD-GCN-BIQA在UHD-IQA基准上取得了具有竞争力的相关性性能,并在绝对质量评分估计方面表现更优,RMSE最低。
📝 摘要(中文)
针对超高清(UHD)图像的盲图像质量评估(BIQA)问题,传统方法面临计算量大、缩放失真和局部信息丢失等挑战。本文提出一种基于图表示学习的UHD-GCN-BIQA框架,显式建模采样图像区域之间的结构依赖关系。该框架从每张UHD图像中采样宽高比对齐的图像块,将其编码为图节点,并使用空间邻近性和特征相似性构建混合k近邻图。利用残差图卷积在区域间传播上下文信息,并通过门控注意力池化将块级证据聚合为图像级质量预测。采用指数移动平均归一化的多目标损失函数,稳定回归、相关性和排序目标的联合优化。在UHD-IQA基准上的实验表明,UHD-GCN-BIQA取得了PLCC = 0.7784,SRCC = 0.8019和RMSE = 0.0519的性能,在相关性方面具有竞争力,并且RMSE在比较方法中最低。结果表明,基于图的区域关系建模对于UHD图像质量评估是有效的,尤其是在提高高分辨率视觉内容下的绝对质量评分估计方面。
🔬 方法详解
问题定义:论文旨在解决超高清(UHD)图像的盲图像质量评估(BIQA)问题。现有方法主要存在三个痛点:一是直接在原生分辨率上进行推理计算量巨大;二是粗暴的缩放或裁剪操作会抑制尺度敏感的失真;三是孤立地处理局部区域,忽略了局部伪影与全局场景上下文之间的关系。
核心思路:论文的核心思路是通过图表示学习,显式地建模UHD图像中不同区域之间的结构依赖关系。将图像分割成多个区域,并将这些区域视为图中的节点,通过构建图结构来捕捉区域之间的空间关系和特征相似性。这样可以有效地利用上下文信息,提高质量评估的准确性。
技术框架:UHD-GCN-BIQA框架主要包含以下几个阶段:1) 图像分块:从UHD图像中采样宽高比对齐的图像块;2) 图节点编码:将每个图像块编码为图中的一个节点,提取其视觉特征;3) 图构建:基于空间邻近性和特征相似性构建混合k近邻图,连接相邻和相似的节点;4) 图卷积:使用残差图卷积网络在图上传播上下文信息,更新节点特征;5) 质量预测:通过门控注意力池化层将节点特征聚合为图像级别的质量预测。
关键创新:该论文的关键创新在于将图表示学习引入到UHD图像质量评估中,通过显式建模区域间的结构依赖关系,克服了传统方法中忽略上下文信息的问题。与现有方法相比,UHD-GCN-BIQA能够更好地捕捉图像中的全局信息和局部细节,从而提高质量评估的准确性。
关键设计:在图构建阶段,采用了混合k近邻图,同时考虑了空间邻近性和特征相似性,以更全面地捕捉区域之间的关系。在图卷积阶段,使用了残差图卷积网络,可以有效地缓解梯度消失问题,并提高网络的表达能力。损失函数方面,采用了指数移动平均归一化的多目标损失函数,稳定回归、相关性和排序目标的联合优化。
🖼️ 关键图片
📊 实验亮点
实验结果表明,UHD-GCN-BIQA在UHD-IQA基准上取得了显著的性能提升,PLCC达到0.7784,SRCC达到0.8019,RMSE降低到0.0519。与其他方法相比,UHD-GCN-BIQA在相关性方面具有竞争力,并且在绝对质量评分估计方面表现更优,RMSE最低,验证了图表示学习在UHD图像质量评估中的有效性。
🎯 应用场景
该研究成果可应用于视频监控、医学影像、遥感图像等领域,提升超高清图像的质量评估效果。在视频监控中,可以自动评估视频质量,及时发现异常情况。在医学影像中,可以辅助医生诊断,提高诊断准确率。在遥感图像中,可以评估图像质量,为后续分析提供保障。该研究具有重要的实际应用价值和广阔的应用前景。
📄 摘要(原文)
Blind image quality assessment (BIQA) for ultrahighdefinition (UHD) images remains challenging because native-resolution inference is computationally expensive, whereas aggressive resizing or isolated cropping may suppress scale-sensitive distortions and weaken the relationship between local artifacts and global scene context. This paper aims to improve UHD-BIQA by explicitly modeling the structural dependencies among sampled image regions rather than treating them as independent views, and a graph representation learning framework UHD-GCN-BIQA is proposed. The framework samples aspect-ratio-aligned patches from each UHD image, encodes them as graph nodes, and constructs a hybrid k-nearest-neighbor graph using spatial proximity and feature similarity. Residual graph convolution is used to propagate contextual information across regions, and gated attention pooling aggregates patchlevel evidence into an imagelevel quality prediction. An exponential moving average normalized multiobjective loss function is adopted to stabilize the joint optimization of regression, correlation, and ranking objectives. Experiments on the UHD-IQA benchmark show that UHD-GCN-BIQA achieves PLCC = 0.7784, SRCC = 0.8019, and RMSE = 0.0519, obtaining competitive correlation performance and the lowest RMSE among the compared methods. These results indicate that graph-based region relation modeling is effective for UHD image quality assessment, particularly for improving absolute quality score estimation under high-resolution visual content.