Hierarchical Neural Surfaces for 3D Mesh Compression
作者: Sai Karthikey Pentapati, Gregoire Phillips, Alan Bovik
分类: cs.CG, cs.GR, cs.LG
发布日期: 2025-12-17
💡 一句话要点
提出一种基于分层神经表面的3D网格压缩方法,实现高压缩率和高质量重建。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 3D网格压缩 隐式神经表示 球面参数化 分层结构 几何建模
📋 核心要点
- 传统3D网格压缩方法存在压缩率和重建质量难以兼顾的问题,而基于INR的方法研究较少。
- 该方法通过球面参数化和分层INR,将3D网格表示为紧凑的位移矢量场,实现高效压缩。
- 实验表明,该方法在重建质量和压缩率之间取得了领先的平衡,并能实时解码任意分辨率的网格。
📝 摘要(中文)
本文提出了一种用于压缩零亏格3D流形的紧凑型隐式神经表示(INR)方法。该方法首先将3D网格球面参数化,将网格表面映射到单位球面上,然后构建一个INR,该INR编码定义在其表面上的连续位移矢量场,从而重建原始形状。表示的紧凑性归功于其分层结构,该结构首先恢复编码表面的粗略结构,然后再添加高频细节。一旦计算出INR,就可以从中解码任意分辨率/连通性的3D网格。解码可以实时执行,同时在重建质量和压缩表示的大小之间实现最先进的权衡。
🔬 方法详解
问题定义:现有技术在3D网格压缩方面,通常难以在压缩率和重建质量之间取得平衡。传统的几何表示方法,如三角形网格,虽然应用广泛,但在高精度表示复杂模型时,数据量巨大,压缩效率较低。隐式神经表示(INR)虽然在其他模态上表现出色,但在直接生成三角形网格方面的研究还不够充分。因此,该论文旨在解决如何利用INR实现高效的3D网格压缩,同时保持较高的重建质量的问题。
核心思路:该论文的核心思路是将3D网格的表面映射到一个单位球面上,然后使用一个分层的INR来编码从单位球面到原始3D网格表面的位移矢量场。通过这种方式,可以将复杂的3D几何形状转化为一个相对简单的矢量场表示,从而实现高效的压缩。分层结构允许先编码粗略的形状,再逐步添加细节,进一步提高压缩效率。
技术框架:该方法主要包含以下几个阶段:1) 球面参数化:将输入的3D网格映射到单位球面上,建立网格表面和球面之间的对应关系。2) 位移矢量场编码:构建一个分层的INR网络,用于编码从单位球面到原始3D网格表面的位移矢量场。该网络以球面上的坐标作为输入,输出对应的位移矢量。3) 网格解码:通过查询INR网络,可以获得任意分辨率的球面上的点的位移矢量,从而重建出对应的3D网格。
关键创新:该方法的关键创新在于:1) 球面参数化:将复杂的3D网格压缩问题转化为球面上的位移矢量场编码问题,简化了表示。2) 分层INR:通过分层结构,先编码粗略形状,再逐步添加细节,提高了压缩效率。与直接编码3D坐标相比,位移矢量场更容易压缩,且分层结构能够更好地捕捉不同频率的几何信息。
关键设计:该方法的关键设计包括:1) 球面参数化方法:选择合适的球面参数化方法,以减少映射过程中的扭曲。2) INR网络结构:设计合适的分层网络结构,例如使用多层感知机(MLP)或卷积神经网络(CNN),以有效地编码位移矢量场。3) 损失函数:使用合适的损失函数来训练INR网络,例如均方误差(MSE)或Chamfer Distance,以保证重建质量。
🖼️ 关键图片
📊 实验亮点
该论文提出的方法在3D网格压缩方面取得了显著的成果。实验结果表明,该方法在重建质量和压缩率之间实现了最先进的权衡。与现有的压缩方法相比,该方法能够在保持较高重建质量的同时,显著减小压缩后的文件大小。此外,该方法还支持实时解码,可以快速生成任意分辨率的3D网格。
🎯 应用场景
该研究成果可广泛应用于3D模型存储、传输和渲染等领域。例如,在游戏开发中,可以减小游戏资源的体积,提高加载速度。在虚拟现实和增强现实应用中,可以降低对带宽和计算资源的需求。此外,该方法还可以应用于3D打印、计算机辅助设计(CAD)等领域,促进相关技术的发展。
📄 摘要(原文)
Implicit Neural Representations (INRs) have been demonstrated to achieve state-of-the-art compression of a broad range of modalities such as images, videos, 3D surfaces, and audio. Most studies have focused on building neural counterparts of traditional implicit representations of 3D geometries, such as signed distance functions. However, the triangle mesh-based representation of geometry remains the most widely used representation in the industry, while building INRs capable of generating them has been sparsely studied. In this paper, we present a method for building compact INRs of zero-genus 3D manifolds. Our method relies on creating a spherical parameterization of a given 3D mesh - mapping the surface of a mesh to that of a unit sphere - then constructing an INR that encodes the displacement vector field defined continuously on its surface that regenerates the original shape. The compactness of our representation can be attributed to its hierarchical structure, wherein it first recovers the coarse structure of the encoded surface before adding high-frequency details to it. Once the INR is computed, 3D meshes of arbitrary resolution/connectivity can be decoded from it. The decoding can be performed in real time while achieving a state-of-the-art trade-off between reconstruction quality and the size of the compressed representations.