论文阅读——Effificient Multiple Organ Localization in CT Image Using 3D Region Proposal Network

最新推荐文章于 2023-04-07 15:26:15 发布

原创最新推荐文章于 2023-04-07 15:26:15 发布 · 583 阅读

4 ·

CC 4.0 BY-SA版权

论文同时被 2 个专栏收录

16 篇文章

订阅专栏

目标检测

3 篇文章

订阅专栏

该论文提出了使用3D区域提案网络（RPN）进行CT图像中器官定位的方法，解决了传统2D方法的冗余和空间信息利用不足问题。作者设计了新的backbone网络，提高了对小器官检测的精度，并建立了一个公开的器官定位数据集。实验结果显示，提出的3D RPN方法在速度和精度上优于2D方法，尤其在处理小器官时更为显著。此外，还采用数据增强策略和特定的冗余去除策略来优化模型。损失函数结合了分类和回归损失，并对背景类别进行了平衡处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文【Effificient Multiple Organ Localization in CT Image Using 3D Region Proposal Network】

前几年的CT图像器官检测中的深度学习方法常用2D slices，比如利用冠状面、矢状面、横断面的CT slices训练3个独立的2D网络，通过3个预测B-box确定器官的形心和范围等等一些2D方法。

这些策略有两个局限性：
第一，相邻层很相似，冗余大，一层一层预测时间消耗多。

第二，不能充分利用CT图像的3D空间信息。

因此作者尝试利用建立3D网络进行器官检测，首先作者做了将Faster R-CNN 3D化进行CT器官检测的实验，精度可与state-of-art方法相比，并且速度更快。同时考虑到CT器官特性，即很多器官具有单一性，不会出现第二个，作者做了进一步改进直接对同一标签的B-boxes进行融合。将R-CNN框架扩展到3D有人做过，但据作者所知，这是第一次有人将其扩展到3D CT器官定位领域。

本文的贡献：
1、提出基于3D RPN的CT器官定位方法，相比于最优的2D ConvNet-based方法快4到18倍。

2、设计了一种新的backbone网络，可以提取更高分辨率的特征图，比最优方法精度更高，对小器官更是如此。

3、建立了一个器官定位的公开数据集，其中包括11种器官及其B-box标注。这是当前第一个器官定位公开数据集。

数据增强：
1、输入CT中随机采样。采样CT的slice数量最小为50，采样中截断的B-boxes看为背景。
2、沿冠状面和矢状面法线进行10mm内平移。

Backbone:作者基于AlexNet设计了提取特征图的backbone，其中应用了skip connection获取丰富的空间和语义信息，利用反卷积进行上采样，每个卷积层后应用Batch normalization。

在这里插入图片描述