EchoTracker2: Enhancing Myocardial Point Tracking by Modeling Local Motion

📄 arXiv: 2605.12140v1 📥 PDF

作者: Md Abulkalam Azad, Vegard Holmstrøm, John Nyberg, Lasse Lovstakken, Håvard Dalen, Bjørnar Grenne, Andreas Østvik

分类: cs.CV

发布日期: 2026-05-12

备注: Early accepted (top 9%) to MICCAI 2026

🔗 代码/项目: GITHUB


💡 一句话要点

EchoTracker2:通过建模局部运动增强心肌点追踪

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: 心肌点追踪 超声心动图 运动估计 局部运动建模 时间推理

📋 核心要点

  1. 现有心肌点追踪方法在处理心肌运动时,未能充分利用其生理约束下的局部连续形变特性。
  2. EchoTracker2通过去除粗略初始化阶段,专注于精细特征提取和局部时空上下文建模,提升追踪精度。
  3. 实验表明,EchoTracker2在多个数据集上显著提升了心肌点追踪的精度和轨迹准确性,并与专家评估结果更一致。

📝 摘要(中文)

心肌点追踪(MPT)作为超声心动图运动估计的一种有前景的方法,受益于通用点追踪方法的进步。然而,心肌运动与自然视频中的运动存在根本差异,它源于生理约束下的形变,在整个心动周期中具有空间和时间上的连续性。因此,尽管组织形变显著,运动轨迹通常保持局部约束。受这些特性启发,我们重新审视了MPT的架构设计,发现常用的两阶段粗到精架构中的粗略初始化可能是不必要的。本文提出了一种仅包含精细阶段的架构 extbf{EchoTracker2},它利用局部时空上下文丰富像素精确的特征,并将其与远程联合时间推理相结合,以实现鲁棒的追踪。在同分布、异分布(OOD)和公共合成数据集上的实验结果表明,相对于领域特定的最先进(SOTA)模型,我们的模型将位置精度提高了6.5%,并将中值轨迹误差降低了12.2%。与最佳通用点追踪方法相比,改进分别为2.0%和5.3%。此外,EchoTracker2在专家推导的整体纵向应变(GLS)方面表现出更好的一致性,并提高了测试-再测试的可重复性。源代码可在https://github.com/riponazad/ptecho获取。

🔬 方法详解

问题定义:心肌点追踪(MPT)旨在准确估计超声心动图中的心肌运动。现有方法,特别是基于通用点追踪的两阶段粗到精架构,在心肌运动这种具有局部连续形变特性的场景下表现不佳,因为粗略初始化阶段可能引入误差,且未能充分利用心肌运动的生理约束。

核心思路:论文的核心思路是针对心肌运动的特性,简化MPT架构,去除不必要的粗略初始化阶段,专注于精细特征提取和局部时空上下文建模。通过这种方式,模型可以更好地捕捉心肌组织的局部形变,并提高追踪精度。

技术框架:EchoTracker2采用单阶段的精细追踪架构。该架构首先提取像素级别的特征,然后利用局部时空上下文信息增强这些特征。增强后的特征被输入到远程联合时间推理模块,以实现鲁棒的追踪。整体流程包括特征提取、局部时空上下文建模和时间推理三个主要模块。

关键创新:EchoTracker2的关键创新在于其单阶段精细追踪架构,以及对局部时空上下文的建模。与传统的两阶段方法相比,该方法避免了粗略初始化带来的误差,并更有效地利用了心肌运动的局部连续性。此外,远程联合时间推理模块也有助于提高追踪的鲁棒性。

关键设计:具体的网络结构和参数设置在论文中未详细描述,但可以推断,局部时空上下文建模可能使用了卷积神经网络或循环神经网络等技术。损失函数的设计可能包括位置损失和轨迹平滑损失,以保证追踪的准确性和轨迹的连续性。远程联合时间推理模块的具体实现方式未知。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

EchoTracker2在多个数据集上取得了显著的性能提升。在同分布数据集上,位置精度提高了6.5%,中值轨迹误差降低了12.2%,优于领域内SOTA模型。与通用点追踪方法相比,位置精度和中值轨迹误差分别提升了2.0%和5.3%。此外,EchoTracker2与专家评估的GLS指标具有更好的一致性,并提高了测试-再测试的可重复性,表明其具有良好的临床应用潜力。

🎯 应用场景

该研究成果可应用于超声心动图的心肌运动分析,帮助医生更准确地评估心脏功能,诊断心脏疾病,并监测治疗效果。通过提高心肌点追踪的精度,可以更可靠地计算整体纵向应变(GLS)等指标,为临床决策提供更准确的依据。未来,该技术有望集成到商用超声设备中,提升临床诊断水平。

📄 摘要(原文)

Myocardial point tracking (MPT) has recently emerged as a promising direction for motion estimation in echocardiography, driven by advances in general-purpose point tracking methods. However, myocardial motion fundamentally differs from motion encountered in natural videos, as it arises from physiologically constrained deformation that is spatially and temporally continuous throughout the cardiac cycle. Consequently, motion trajectories typically remain locally confined despite substantial tissue deformation. Motivated by these properties, we revisit the architectural design for MPT and find that coarse initialization in commonly used two-stage coarse-to-fine architectures may be unnecessary in this domain. In this work, we propose a fine-stage-only architecture, \textbf{EchoTracker2}, which enriches pixel-precise features with local spatiotemporal context and integrates them with long-range joint temporal reasoning for robust tracking. Experimental results across in-distribution, out-of-distribution (OOD), and public synthetic datasets show that our model improves position accuracy by $6.5\%$ and reduces median trajectory error by $12.2\%$ relative to a domain-specific state-of-the-art (SOTA) model. Compared to the best general-purpose point tracking method, the improvements are $2.0\%$ and $5.3\%$, respectively. Moreover, EchoTracker2 shows better agreement with expert-derived global longitudinal strain (GLS) and enhances test-rest reproducibility. Source code will be available at: https://github.com/riponazad/ptecho.