Bridging the Geometry Mismatch: Frequency-Aware Anisotropic Serialization for Thin-Structure SSMs
作者: Jin Bai, Huiyao Zhang, Qi Wen, Ningyang Li, Shengyang Li, Atta ur Rahman, Xiaolin Tian
分类: cs.CV
发布日期: 2026-03-30
💡 一句话要点
提出FGOS-Net以解决薄结构SSM的几何不匹配问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 薄结构分割 状态空间模型 频率感知 几何解耦 主动探测 深度学习 计算机视觉
📋 核心要点
- 现有的状态空间模型在处理薄线性结构时,因各向同性序列化导致几何不匹配,影响了长距离连接的准确性。
- 本文提出FGOS-Net,通过频率感知的几何解耦,纠正下采样引起的空间错位,并实现频率对齐扫描。
- 在多个基准测试中,FGOS-Net表现优异,特别是在DeepCrack数据集上,达到了91.3%的mIoU和97.1%的clDice。
📝 摘要(中文)
薄线性结构的分割在拓扑上是高度敏感的,局部错误可能导致长距离连接的断裂。尽管近期的状态空间模型(SSMs)在长距离建模上表现出色,但其各向同性序列化(如光栅扫描)对各向异性目标造成几何不匹配,导致状态沿结构轨迹的传播不准确。为了解决这一问题,本文提出了FGOS-Net框架,基于频率感知的几何解耦。我们首先将特征分解为稳定的拓扑载体和方向性高频带,利用后者显式纠正下采样引起的空间错位。在此基础上,我们引入频率对齐扫描,将序列化提升为几何条件决策,保持方向一致的轨迹。结合主动探测策略,FGOS-Net在四个具有挑战性的基准测试中始终优于强基线,尤其在DeepCrack上实现了91.3%的mIoU和97.1%的clDice,同时以80 FPS的速度运行,仅需7.87 GFLOPs。
🔬 方法详解
问题定义:本文旨在解决薄线性结构分割中的几何不匹配问题,现有方法在处理各向异性目标时容易出现状态传播不准确的情况。
核心思路:FGOS-Net通过频率感知的几何解耦,将特征分解为稳定拓扑和方向性高频带,从而有效纠正空间错位。
技术框架:FGOS-Net的整体架构包括特征分解模块、频率对齐扫描模块和主动探测策略,确保在序列化过程中保持方向一致性。
关键创新:最重要的创新在于频率对齐扫描的引入,使得序列化过程能够根据几何特性进行决策,显著提升了分割精度。
关键设计:在网络结构中,采用了特征分解和高频细节注入的策略,损失函数设计上注重空间一致性和方向性,确保模型在处理复杂结构时的稳定性。
🖼️ 关键图片
📊 实验亮点
FGOS-Net在DeepCrack数据集上取得了91.3%的mIoU和97.1%的clDice,运行速度达到80 FPS,计算复杂度仅为7.87 GFLOPs,显著优于现有强基线,展示了其在薄结构分割中的卓越性能。
🎯 应用场景
该研究在薄结构分割领域具有广泛的应用潜力,尤其是在医学影像分析、道路检测和建筑结构识别等场景中。通过提高分割精度,FGOS-Net能够为相关领域提供更可靠的数据支持,推动自动化和智能化的发展。
📄 摘要(原文)
The segmentation of thin linear structures is inherently topology allowbreak-critical, where minor local errors can sever long-range connectivity. While recent State-Space Models (SSMs) offer efficient long-range modeling, their isotropic serialization (e.g., raster scanning) creates a geometry mismatch for anisotropic targets, causing state propagation across rather than along the structure trajectories. To address this, we propose FGOS-Net, a framework based on frequency allowbreak-geometric disentanglement. We first decompose features into a stable topology carrier and directional high-frequency bands, leveraging the latter to explicitly correct spatial misalignments induced by downsampling. Building on this calibrated topology, we introduce frequency-aligned scanning that elevates serialization to a geometry-conditioned decision, preserving direction-consistent traces. Coupled with an active probing strategy to selectively inject high-frequency details and suppress texture ambiguity, FGOS-Net consistently outperforms strong baselines across four challenging benchmarks. Notably, it achieves 91.3% mIoU and 97.1% clDice on DeepCrack while running at 80 FPS with only 7.87 GFLOPs.