Cholec80-port: A Geometrically Consistent Trocar Port Segmentation Dataset for Robust Surgical Scene Understanding

📄 arXiv: 2602.17060v1 📥 PDF

作者: Shunsuke Kikuchi, Atsushi Kouno, Hiroki Matsuzaki

分类: cs.CV

发布日期: 2026-02-19


💡 一句话要点

提出几何一致的Cholec80-port数据集,提升手术场景理解的鲁棒性

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱七:动作重定向 (Motion Retargeting)

关键词: 腹腔镜手术 套管端口分割 几何一致性 数据集构建 手术场景理解

📋 核心要点

  1. 腹腔镜手术中的套管端口会干扰基于几何的算法,但现有数据集缺乏精确标注。
  2. 论文提出一种严格的标准操作程序(SOP),用于创建几何一致的套管端口分割掩码,并构建了Cholec80-port数据集。
  3. 实验表明,使用几何一致的标注可以显著提高跨数据集的鲁棒性,优于仅增加数据集规模。

📝 摘要(中文)

Trocar套管端口是相机固定的伪静态结构,会持续遮挡腹腔镜视野,并因其镜面反射和纹理表面而吸引大量特征点。这使得端口对基于几何的下游流程(如图像拼接、3D重建和视觉SLAM)产生不利影响,因为动态或非解剖异常值会降低对齐和跟踪的稳定性。尽管其具有实际重要性,但公共手术数据集中很少有明确的端口标签,并且现有的标注通常会因掩盖中心管腔(开口)而违反几何一致性,即使解剖区域通过它可见。我们提出了Cholec80-port,这是一个从Cholec80派生的、高保真度的套管端口分割数据集,以及定义排除中心开口的端口套管掩码的严格标准操作程序(SOP)。我们还使用相同的SOP清理和统一了现有的公共数据集。实验表明,几何一致的标注显著提高了跨数据集的鲁棒性,超越了仅靠数据集大小所能提供的效果。

🔬 方法详解

问题定义:腹腔镜手术中,套管端口是固定在相机上的伪静态结构,由于其镜面反射和纹理,容易吸引大量特征点,从而干扰基于几何的下游任务,如图像拼接、3D重建和视觉SLAM。现有的公开手术数据集缺乏对套管端口的精确标注,并且已有的标注常常忽略了端口中心的管腔开口,导致几何不一致性,降低了算法的鲁棒性。

核心思路:论文的核心思路是构建一个具有几何一致性的套管端口分割数据集,通过定义严格的标准操作程序(SOP),确保标注的准确性和一致性。该SOP明确规定端口套管的掩码应排除中心开口,从而避免将通过端口可见的解剖区域错误地标记为端口的一部分。

技术框架:论文主要包含以下几个阶段:1) 定义严格的标准操作程序(SOP),用于套管端口的标注;2) 基于Cholec80数据集,按照SOP创建高质量的Cholec80-port数据集;3) 使用SOP清理和统一现有的公共数据集,使其具有几何一致性;4) 通过实验验证几何一致性标注对跨数据集鲁棒性的提升效果。

关键创新:论文最重要的技术创新点在于提出了几何一致性的标注方法,即在标注套管端口时,排除中心管腔开口,确保标注的准确性。这种标注方法与现有方法的主要区别在于,现有方法通常会忽略端口中心的管腔开口,导致标注的几何不一致性。

关键设计:论文的关键设计在于标准操作程序(SOP)的制定,该SOP详细规定了套管端口标注的流程和标准,包括如何确定端口的边界、如何排除中心管腔开口等。此外,论文还对现有的公共数据集进行了清理和统一,使其符合SOP的标准,从而提高了数据集的质量和可用性。具体的参数设置、损失函数、网络结构等技术细节未在摘要中提及,属于未知信息。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果表明,使用几何一致的Cholec80-port数据集进行训练,可以显著提高跨数据集的鲁棒性。相比于使用未进行几何一致性处理的数据集,该方法在目标检测和分割任务上取得了明显的性能提升,验证了几何一致性标注的有效性。

🎯 应用场景

该研究成果可应用于腹腔镜手术机器人导航、手术场景理解、术中图像增强等领域。通过提供更准确的套管端口信息,可以提高手术机器人的定位精度和导航能力,改善手术场景的理解,并为术中图像增强提供更可靠的基础,最终提升手术的安全性和效率。

📄 摘要(原文)

Trocar ports are camera-fixed, pseudo-static structures that can persistently occlude laparoscopic views and attract disproportionate feature points due to specular, textured surfaces. This makes ports particularly detrimental to geometry-based downstream pipelines such as image stitching, 3D reconstruction, and visual SLAM, where dynamic or non-anatomical outliers degrade alignment and tracking stability. Despite this practical importance, explicit port labels are rare in public surgical datasets, and existing annotations often violate geometric consistency by masking the central lumen (opening), even when anatomical regions are visible through it. We present Cholec80-port, a high-fidelity trocar port segmentation dataset derived from Cholec80, together with a rigorous standard operating procedure (SOP) that defines a port-sleeve mask excluding the central opening. We additionally cleanse and unify existing public datasets under the same SOP. Experiments demonstrate that geometrically consistent annotations substantially improve cross-dataset robustness beyond what dataset size alone provides.