Bridging the Geometry Mismatch: Frequency-Aware Anisotropic Serialization for Thin-Structure SSMs

📄 arXiv: 2603.28503v1 📥 PDF

作者: Jin Bai, Huiyao Zhang, Qi Wen, Ningyang Li, Shengyang Li, Atta ur Rahman, Xiaolin Tian

分类: cs.CV

发布日期: 2026-03-30


💡 一句话要点

提出FGOS-Net以解决薄结构SSM的几何不匹配问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 薄结构分割 状态空间模型 频率感知 几何解耦 主动探测 深度学习 计算机视觉

📋 核心要点

  1. 现有的状态空间模型在处理薄线性结构时,因各向同性序列化导致几何不匹配,影响了长距离连接的准确性。
  2. 本文提出FGOS-Net,通过频率感知的几何解耦,纠正下采样引起的空间错位,并实现频率对齐扫描。
  3. 在多个基准测试中,FGOS-Net表现优异,特别是在DeepCrack数据集上,达到了91.3%的mIoU和97.1%的clDice。

📝 摘要(中文)

薄线性结构的分割在拓扑上是高度敏感的,局部错误可能导致长距离连接的断裂。尽管近期的状态空间模型(SSMs)在长距离建模上表现出色,但其各向同性序列化(如光栅扫描)对各向异性目标造成几何不匹配,导致状态沿结构轨迹的传播不准确。为了解决这一问题,本文提出了FGOS-Net框架,基于频率感知的几何解耦。我们首先将特征分解为稳定的拓扑载体和方向性高频带,利用后者显式纠正下采样引起的空间错位。在此基础上,我们引入频率对齐扫描,将序列化提升为几何条件决策,保持方向一致的轨迹。结合主动探测策略,FGOS-Net在四个具有挑战性的基准测试中始终优于强基线,尤其在DeepCrack上实现了91.3%的mIoU和97.1%的clDice,同时以80 FPS的速度运行,仅需7.87 GFLOPs。

🔬 方法详解

问题定义:本文旨在解决薄线性结构分割中的几何不匹配问题,现有方法在处理各向异性目标时容易出现状态传播不准确的情况。

核心思路:FGOS-Net通过频率感知的几何解耦,将特征分解为稳定拓扑和方向性高频带,从而有效纠正空间错位。

技术框架:FGOS-Net的整体架构包括特征分解模块、频率对齐扫描模块和主动探测策略,确保在序列化过程中保持方向一致性。

关键创新:最重要的创新在于频率对齐扫描的引入,使得序列化过程能够根据几何特性进行决策,显著提升了分割精度。

关键设计:在网络结构中,采用了特征分解和高频细节注入的策略,损失函数设计上注重空间一致性和方向性,确保模型在处理复杂结构时的稳定性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

FGOS-Net在DeepCrack数据集上取得了91.3%的mIoU和97.1%的clDice,运行速度达到80 FPS,计算复杂度仅为7.87 GFLOPs,显著优于现有强基线,展示了其在薄结构分割中的卓越性能。

🎯 应用场景

该研究在薄结构分割领域具有广泛的应用潜力,尤其是在医学影像分析、道路检测和建筑结构识别等场景中。通过提高分割精度,FGOS-Net能够为相关领域提供更可靠的数据支持,推动自动化和智能化的发展。

📄 摘要(原文)

The segmentation of thin linear structures is inherently topology allowbreak-critical, where minor local errors can sever long-range connectivity. While recent State-Space Models (SSMs) offer efficient long-range modeling, their isotropic serialization (e.g., raster scanning) creates a geometry mismatch for anisotropic targets, causing state propagation across rather than along the structure trajectories. To address this, we propose FGOS-Net, a framework based on frequency allowbreak-geometric disentanglement. We first decompose features into a stable topology carrier and directional high-frequency bands, leveraging the latter to explicitly correct spatial misalignments induced by downsampling. Building on this calibrated topology, we introduce frequency-aligned scanning that elevates serialization to a geometry-conditioned decision, preserving direction-consistent traces. Coupled with an active probing strategy to selectively inject high-frequency details and suppress texture ambiguity, FGOS-Net consistently outperforms strong baselines across four challenging benchmarks. Notably, it achieves 91.3% mIoU and 97.1% clDice on DeepCrack while running at 80 FPS with only 7.87 GFLOPs.