NTIRE 2026 The 3rd Restore Any Image Model (RAIM) Challenge: Professional Image Quality Assessment (Track 1)

作者: Guanyi Qin, Jie Liang, Bingbing Zhang, Lishen Qu, Ya-nan Guan, Hui Zeng, Lei Zhang, Radu Timofte, Jianhui Sun, Xinli Yue, Tao Shao, Huan Hou, Wenjie Liao, Shuhao Han, Jieyu Yuan, Chunle Guo, Chongyi Li, Zewen Chen, Yunze Liu, Jian Guo, Juan Wang, Yun Zeng, Bing Li, Weiming Hu, Hesong Li, Dehua Liu, Xinjie Zhang, Qiang Li, Li Yan, Wei Dong, Qingsen Yan, Xingcan Li, Shenglong Zhou, Manjiang Yin, Yinxiang Zhang, Hongbo Wang, Jikai Xu, Zhaohui Fan, Dandan Zhu, Wei Sun, Weixia Zhang, Kun Zhu, Nana Zhang, Kaiwei Zhang, Qianqian Zhang, Zhihan Zhang, William Gordon, Linwei Wu, Jiachen Tu, Guoyi Xu, Yaoxin Jiang, Cici Liu, Yaokun Shi

分类: cs.CV, cs.AI

发布日期: 2026-04-14

备注: NTIRE Challenge Report. Accepted by CVPRW 2026

🔗 代码/项目: GITHUB

💡 一句话要点

NTIRE 2026 RAIM挑战赛：探索MLLM在专业图像质量评估中的应用

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 图像质量评估 多模态学习 大型语言模型 专业图像处理 可解释性 NTIRE挑战赛 图像恢复 视觉推理

📋 核心要点

传统IQA方法依赖单一标量评分，无法区分高质量图像的细微差别，缺乏可解释性。
挑战赛利用MLLM模仿人类专家，进行高质量图像对的比较选择和解释性推理。
本次挑战赛吸引了大量参与者，显著提升了专业IQA的技术水平，并提供了新的数据集。

📝 摘要（中文）

本文概述了NTIRE 2026中第三届“任意图像模型恢复（RAIM）”挑战赛，特别关注Track 1：专业图像质量评估。传统的图像质量评估（IQA）通常依赖于标量分数，这种方法将复杂的视觉特征压缩成一个单一的数字，难以区分高质量图像之间的细微差异，并且无法解释图像优劣的原因，缺乏为视觉任务提供指导的推理能力。为了弥合这一差距，多模态大型语言模型（MLLM）的最新进展提供了一种有前景的范例。受此启发，本次挑战赛建立了一个新的基准，探索MLLM在模仿人类专家认知以评估高质量图像对方面的能力。参与者需要克服专业场景中的关键瓶颈，主要围绕两个目标：（1）比较质量选择：可靠地识别高质量图像对中视觉上更优的图像；（2）解释性推理：生成有根据的、专家级别的解释，详细说明选择背后的理由。本次挑战赛共吸引了近200个注册和超过2500个提交。表现最佳的方法显著提高了专业IQA的水平。挑战赛数据集可在https://github.com/narthchin/RAIM-PIQA 获得，官方主页可在https://www.codabench.org/competitions/12789/ 访问。

🔬 方法详解

问题定义：传统图像质量评估方法主要依赖于单一的标量分数，这使得它们难以区分高质量图像之间细微的质量差异。此外，这些方法缺乏可解释性，无法给出图像质量优劣的理由，从而限制了其在需要解释和指导的视觉任务中的应用。因此，如何设计一种能够区分高质量图像差异并提供合理评估依据的IQA方法是一个关键问题。

核心思路：本挑战赛的核心思路是利用多模态大型语言模型（MLLM）来模拟人类专家的认知过程，对高质量图像进行评估。通过让MLLM同时处理图像信息和文本信息，使其能够像人类专家一样，不仅能够判断图像质量的优劣，还能够给出选择的理由，从而提高IQA的可解释性和实用性。

技术框架：本次挑战赛的技术框架主要包括两个阶段：比较质量选择和解释性推理。在比较质量选择阶段，MLLM需要判断给定的高质量图像对中哪一个图像质量更好。在解释性推理阶段，MLLM需要生成一段文本，详细解释其选择的原因。整个流程旨在模拟人类专家评估图像质量的过程，并利用MLLM的强大能力来提高IQA的性能。

关键创新：本次挑战赛的关键创新在于引入了MLLM来进行专业图像质量评估，并将其应用于高质量图像的比较和解释。与传统的IQA方法相比，MLLM不仅能够提供图像质量的评分，还能够给出选择的理由，从而提高了IQA的可解释性和实用性。此外，本次挑战赛还建立了一个新的基准数据集，为未来的研究提供了数据支持。

关键设计：具体的MLLM模型选择和训练策略由参赛者自行决定。挑战赛重点关注模型在比较质量选择和解释性推理方面的表现。评价指标包括选择的准确率以及生成解释的合理性和专业性。鼓励参赛者探索不同的MLLM架构、训练方法和提示工程技术，以提高模型在专业IQA任务中的性能。

🖼️ 关键图片

📊 实验亮点

本次挑战赛吸引了近200个注册和超过2500个提交，表明了该研究方向的广泛关注度。表现最佳的方法在专业IQA方面取得了显著的进展，证明了MLLM在图像质量评估领域的巨大潜力。挑战赛提供的数据集和评估标准将为未来的研究提供有力的支持。

🎯 应用场景

该研究成果可应用于专业图像处理、摄影后期、图像修复等领域，帮助专业人士更准确地评估和优化图像质量。同时，该方法在医学影像、遥感图像等领域也具有潜在的应用价值，能够辅助医生或专家进行更精确的诊断和分析，具有重要的实际价值和深远影响。

📄 摘要（原文）

In this paper, we present an overview of the NTIRE 2026 challenge on the 3rd Restore Any Image Model in the Wild, specifically focusing on Track 1: Professional Image Quality Assessment. Conventional Image Quality Assessment (IQA) typically relies on scalar scores. By compressing complex visual characteristics into a single number, these methods fundamentally struggle to distinguish subtle differences among uniformly high-quality images. Furthermore, they fail to articulate why one image is superior, lacking the reasoning capabilities required to provide guidance for vision tasks. To bridge this gap, recent advancements in Multimodal Large Language Models (MLLMs) offer a promising paradigm. Inspired by this potential, our challenge establishes a novel benchmark exploring the ability of MLLMs to mimic human expert cognition in evaluating high-quality image pairs. Participants were tasked with overcoming critical bottlenecks in professional scenarios, centering on two primary objectives: (1) Comparative Quality Selection: reliably identifying the visually superior image within a high-quality pair; and (2) Interpretative Reasoning: generating grounded, expert-level explanations that detail the rationale behind the selection. In total, the challenge attracted nearly 200 registrations and over 2,500 submissions. The top-performing methods significantly advanced the state of the art in professional IQA. The challenge dataset is available at https://github.com/narthchin/RAIM-PIQA, and the official homepage is accessible at https://www.codabench.org/competitions/12789/.

NTIRE 2026 The 3rd Restore Any Image Model (RAIM) Challenge: Professional Image Quality Assessment (Track 1)

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理