LP$^{2}$DH: A Locality-Preserving Pixel-Difference Hashing Framework for Dynamic Texture Recognition

📄 arXiv: 2604.15707v1 📥 PDF

作者: Ruxin Ding, Jianfeng Ren, Heng Yu, Jiawei Li, Xudong Jiang

分类: cs.CV

发布日期: 2026-04-17

🔗 代码/项目: GITHUB


💡 一句话要点

提出LP²DH框架以解决动态纹理识别中的高维特征问题

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 动态纹理识别 局部保持 哈希技术 特征提取 字典学习 机器学习 计算机视觉

📋 核心要点

  1. 现有的动态纹理描述符STLBP在高维特征提取上存在计算复杂度高的问题,且在正交平面提取时损失了平面间的相关性。
  2. 本文提出的LP²DH框架通过联合编码全时空邻域的像素差异,生成具有最大区分能力的紧凑二进制码,并保持局部结构。
  3. LP²DH在UCLA、DynTex++和YUPENN三个动态纹理识别基准上分别达到了99.80%、98.52%和96.19%的识别率,超越了现有方法。

📝 摘要(中文)

时空局部二值模式(STLBP)是一种广泛使用的动态纹理描述符,但其高维特性导致了计算复杂度的增加。为了解决这一问题,STLBP特征通常在三个正交平面上提取,这牺牲了平面间的相关性。本文提出了一种局部保持像素差异哈希(LP²DH)框架,能够联合编码全时空邻域中的像素差异。LP²DH将像素差异向量(PDVs)转化为具有最大区分能力的紧凑二进制码,并通过局部保持嵌入来维护PDVs的局部结构。随后,采用曲线搜索策略,通过在Stiefel流形上的梯度下降联合优化哈希矩阵和二进制码。最后,应用字典学习将二进制向量编码为词汇,生成的直方图作为最终特征表示。LP²DH在三个主要动态纹理识别基准上实现了最先进的性能。

🔬 方法详解

问题定义:本文旨在解决动态纹理识别中STLBP特征高维度带来的计算复杂度问题,以及在正交平面提取时导致的平面间相关性损失。

核心思路:提出的LP²DH框架通过联合编码全时空邻域中的像素差异,生成紧凑的二进制码,同时通过局部保持嵌入技术维护PDVs的局部结构,从而提高识别性能。

技术框架:LP²DH的整体架构包括像素差异向量的提取、局部保持嵌入、哈希矩阵和二进制码的联合优化,以及字典学习生成最终特征表示的多个模块。

关键创新:LP²DH的主要创新在于其局部保持嵌入和曲线搜索策略的结合,能够有效保持数据的局部结构并优化哈希过程,与传统方法相比具有更高的区分能力。

关键设计:在设计中,采用了基于Stiefel流形的梯度下降法进行哈希矩阵和二进制码的优化,并通过字典学习将生成的二进制向量编码为词汇,形成最终的特征直方图。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

LP²DH在UCLA、DynTex++和YUPENN三个动态纹理识别基准上分别取得了99.80%、98.52%和96.19%的识别率,显著超越了DT-GoogleNet、HoGF³D和STS等现有方法,证明了其在动态纹理识别中的有效性和优越性。

🎯 应用场景

该研究的潜在应用领域包括视频监控、智能交通、虚拟现实等动态场景的分析与识别。通过提高动态纹理识别的准确性和效率,LP²DH框架能够为相关行业提供更为精准的技术支持,推动智能化应用的发展。

📄 摘要(原文)

Spatiotemporal Local Binary Pattern (STLBP) is a widely used dynamic texture descriptor, but it suffers from extremely high dimensionality. To tackle this, STLBP features are often extracted on three orthogonal planes, which sacrifice inter-plane correlation. In this work, we propose a Locality-Preserving Pixel-Difference Hashing (LP$^{2}$DH) framework that jointly encodes pixel differences in the full spatiotemporal neighbourhood. LP$^{2}$DH transforms Pixel-Difference Vectors (PDVs) into compact binary codes with maximal discriminative power. Furthermore, we incorporate a locality-preserving embedding to maintain the PDVs' local structure before and after hashing. Then, a curvilinear search strategy is utilized to jointly optimize the hashing matrix and binary codes via gradient descent on the Stiefel manifold. After hashing, dictionary learning is applied to encode the binary vectors into codewords, and the resulting histogram is utilized as the final feature representation. The proposed LP$^{2}$DH achieves state-of-the-art performance on three major dynamic texture recognition benchmarks: 99.80% against DT-GoogleNet's 98.93% on UCLA, 98.52% against HoGF$^{3D}$'s 97.63% on DynTex++, and 96.19% compared to STS's 95.00% on YUPENN. The source code is available at: https://github.com/drx770/LP2DH.