论文阅读——Effificient Multiple Organ Localization in CT Image Using 3D Region Proposal Network

该论文提出了使用3D区域提案网络(RPN)进行CT图像中器官定位的方法,解决了传统2D方法的冗余和空间信息利用不足问题。作者设计了新的backbone网络,提高了对小器官检测的精度,并建立了一个公开的器官定位数据集。实验结果显示,提出的3D RPN方法在速度和精度上优于2D方法,尤其在处理小器官时更为显著。此外,还采用数据增强策略和特定的冗余去除策略来优化模型。损失函数结合了分类和回归损失,并对背景类别进行了平衡处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文【Effificient Multiple Organ Localization in CT Image Using 3D Region Proposal Network】

前几年的CT图像器官检测中的深度学习方法常用2D slices,比如利用冠状面、矢状面、横断面的CT slices训练3个独立的2D网络,通过3个预测B-box确定器官的形心和范围等等一些2D方法。

这些策略有两个局限性
第一,相邻层很相似,冗余大,一层一层预测时间消耗多。

第二,不能充分利用CT图像的3D空间信息。

因此作者尝试利用建立3D网络进行器官检测,首先作者做了将Faster R-CNN 3D化进行CT器官检测的实验,精度可与state-of-art方法相比,并且速度更快。同时考虑到CT器官特性,即很多器官具有单一性,不会出现第二个,作者做了进一步改进直接对同一标签的B-boxes进行融合。将R-CNN框架扩展到3D有人做过,但据作者所知,这是第一次有人将其扩展到3D CT器官定位领域。

本文的贡献:
1、提出基于3D RPN的CT器官定位方法,相比于最优的2D ConvNet-based方法快4到18倍。

2、设计了一种新的backbone网络,可以提取更高分辨率的特征图,比最优方法精度更高,对小器官更是如此。

3、建立了一个器官定位的公开数据集,其中包括11种器官及其B-box标注。这是当前第一个器官定位公开数据集。

数据增强
1、输入CT中随机采样。采样CT的slice数量最小为50,采样中截断的B-boxes看为背景。
2、沿冠状面和矢状面法线进行10mm内平移。

Backbone:作者基于AlexNet设计了提取特征图的backbone,其中应用了skip connection获取丰富的空间和语义信息,利用反卷积进行上采样,每个卷积层后应用Batch normalization。

在这里插入图片描述

Region Proposal Network for B-Box Prediction:
类似于faster R-CNN的anchor box,预设了一些先验框的尺寸大小,每个特征图cell定义了64个先验框,最终为每个先验框输出K+1维类别的分数和6维的先验框调整参数。

去除冗余:生成的候选框包含大量冗余,用一下策略去除:
1、类别分数大于0.9。

2、类别分数在所有相关候选框top 10%。

3、由于器官具有唯一性,直接将1、2剩余候选框加权平均。

Loss Functions
先为所有的先验框设置label,与ground truth的IOU大于阈值T1的标记为该ground truth label > 0,IOU小于阈值T2的标记为背景label=0,处于中间的标记为-1不参与训练loss。然后计算LOSS:
在这里插入图片描述

前者是分类loss,后者则是包围框回归loss。
在这里插入图片描述

由于背景过多,为了平衡类别为包括背景在内的每一类添加系数,大小为该类别数量分之一。
在这里插入图片描述
在这里插入图片描述
回归loss直接从faster R-CNN中使用的L1 loss扩展而来。

实验:利用IOU、预测框与ground truth之间的wall distance和质心距离作为衡量指标。部分结果如下:

在这里插入图片描述
上半部分实验结果不在同一数据集下得到,下半部分实验在本文发布的新数据LiTS上得到,De.和Humpire.的实验结果为作者复现。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值