ZDySS -- Zero-Shot Dynamic Scene Stylization using Gaussian Splatting

作者: Abhishek Saroha, Florian Hofherr, Mariia Gladkova, Cecilia Curreli, Or Litany, Daniel Cremers

分类: cs.CV

发布日期: 2025-01-07

💡 一句话要点

提出ZDySS，利用高斯溅射实现动态场景的零样本风格迁移

🎯 匹配领域: 支柱三：空间感知与语义 (Perception & Semantics)

关键词: 动态场景风格迁移 零样本学习 高斯溅射 时空一致性 特征空间风格迁移

📋 核心要点

动态场景风格迁移旨在根据示例图像对动态场景进行风格化，但现有方法难以保证时空一致性。
ZDySS通过将高斯溅射与学习到的特征向量相结合，在特征空间而非图像空间进行风格迁移，从而提升时空一致性。
实验表明，ZDySS在真实动态场景中优于现有方法，为实际应用提供了更鲁棒的解决方案。

📝 摘要（中文）

本文提出了一种针对动态场景的零样本风格迁移框架ZDySS。该框架允许模型在推理阶段泛化到之前未见过的风格图像。该方法采用高斯溅射进行场景表示，并将每个高斯与一个学习到的特征向量相关联，从而为任何给定的视角和时间戳渲染特征图。通过在学习到的特征向量上应用风格迁移，而不是在渲染的特征图上，增强了跨帧的时空一致性。在真实动态场景的测试中，该方法在性能和连贯性方面优于最先进的基线，使其成为实际应用的强大解决方案。

🔬 方法详解

问题定义：现有动态场景风格迁移方法通常针对静态场景设计，且需要为每个风格图像进行优化，泛化能力有限，难以保证时空一致性。因此，需要一种能够零样本泛化到新风格，并保持动态场景时空一致性的风格迁移方法。

核心思路：ZDySS的核心在于利用高斯溅射（Gaussian Splatting）作为动态场景的表示，并将每个高斯与一个学习到的特征向量相关联。通过在这些特征向量上进行风格迁移，而不是直接在渲染的图像上进行，可以更好地保持时空一致性。因为特征向量的变化更加平滑，从而避免了渲染图像中可能出现的闪烁或不连续现象。

技术框架：ZDySS的整体框架包括以下几个主要阶段：1) 使用高斯溅射表示动态场景；2) 为每个高斯学习一个特征向量；3) 使用风格迁移算法（如AdaIN）在学习到的特征向量上进行风格迁移；4) 使用高斯溅射渲染风格化后的场景。该框架的关键在于将风格迁移操作放在特征空间，而非图像空间。

关键创新：ZDySS的关键创新在于将高斯溅射与特征向量学习相结合，实现了动态场景的零样本风格迁移。与现有方法相比，ZDySS无需为每个风格图像进行优化，并且能够更好地保持时空一致性。通过在特征空间进行风格迁移，避免了直接在图像空间操作可能导致的不连续性。

关键设计：ZDySS使用高斯溅射来表示动态场景，每个高斯包含位置、颜色、不透明度和缩放等参数。特征向量的学习通过一个神经网络实现，该网络将高斯的参数作为输入，输出一个特征向量。风格迁移算法采用AdaIN，它将内容特征的均值和方差替换为风格特征的均值和方差。损失函数包括风格损失、内容损失和正则化项，用于保证风格迁移的效果和场景的真实性。

🖼️ 关键图片

📊 实验亮点

ZDySS在真实动态场景的实验中表现出优越的性能。与现有的风格迁移方法相比，ZDySS在时空一致性方面有显著提升，减少了闪烁和不连续现象。实验结果表明，ZDySS能够生成高质量的风格化动态场景，并且能够泛化到之前未见过的风格图像。

🎯 应用场景

ZDySS在游戏开发、电影制作、增强现实和虚拟现实等领域具有广泛的应用前景。它可以用于快速生成具有特定艺术风格的动态场景，例如将游戏场景渲染成水彩画风格，或者将电影片段转换为卡通风格。此外，ZDySS还可以用于创建个性化的虚拟现实体验，允许用户根据自己的喜好定制虚拟环境的视觉风格。

📄 摘要（原文）

Stylizing a dynamic scene based on an exemplar image is critical for various real-world applications, including gaming, filmmaking, and augmented and virtual reality. However, achieving consistent stylization across both spatial and temporal dimensions remains a significant challenge. Most existing methods are designed for static scenes and often require an optimization process for each style image, limiting their adaptability. We introduce ZDySS, a zero-shot stylization framework for dynamic scenes, allowing our model to generalize to previously unseen style images at inference. Our approach employs Gaussian splatting for scene representation, linking each Gaussian to a learned feature vector that renders a feature map for any given view and timestamp. By applying style transfer on the learned feature vectors instead of the rendered feature map, we enhance spatio-temporal consistency across frames. Our method demonstrates superior performance and coherence over state-of-the-art baselines in tests on real-world dynamic scenes, making it a robust solution for practical applications.

ZDySS -- Zero-Shot Dynamic Scene Stylization using Gaussian Splatting

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理