昇思25天学习打卡营第二十五天|SSD目标检测

原创

于 2024-07-18 09:02:07 发布 · 927 阅读

·

24

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#学习 #目标检测 #人工智能

背景

提供免费算力支持，有交流群有值班教师答疑的华为昇思训练营进入第二十五天了。
今天是第二十五天，也是最后一天。后期会有更多精彩AI技术类文章，欢迎大家关注我。
从第十天开始，进入了应用实战阶段，前九天都是基础入门阶段，具体的学习内容可以看链接
基础学习部分
昇思25天学习打卡营第一天|快速入门
 昇思25天学习打卡营第二天|张量 Tensor
昇思25天学习打卡营第三天|数据集Dataset
昇思25天学习打卡营第四天|数据变换Transforms
昇思25天学习打卡营第五天|网络构建
 昇思25天学习打卡营第六天|函数式自动微分
 昇思25天学习打卡营第七天|模型训练
 昇思25天学习打卡营第八天|保存与加载
 昇思25天学习打卡营第九天|使用静态图加速
应用实践部分
昇思25天学习打卡营第十天|CycleGAN图像风格迁移互换
 昇思25天学习打卡营第十一天|DCGAN生成漫画头像
 昇思25天学习打卡营第十二天|Diffusion扩散模型
 昇思25天学习打卡营第十三天|GAN图像生成
 昇思25天学习打卡营第十四天|Pix2Pix实现图像转换
 昇思25天学习打卡营第十五天|基于 MindSpore 实现 BERT 对话情绪识别
 昇思25天学习打卡营第十六天|基于MindSpore的GPT2文本摘要
 昇思25天学习打卡营第十七天|文本解码原理–以MindNLP为例
 昇思25天学习打卡营第十八天|基于MindNLP+MusicGen生成自己的个性化音乐
 昇思25天学习打卡营第十九天|K近邻算法实现红酒聚类
 昇思25天学习打卡营第二十天|基于MobileNetv2的垃圾分类
 昇思25天学习打卡营第二十一天|FCN图像语义分割
 昇思25天学习打卡营第二十二天|ResNet50迁移学习
 昇思25天学习打卡营第二十三天|ResNet50图像分类
 昇思25天学习打卡营第二十四天|ShuffleNet图像分类

学习内容

模型简介

SSD，全称Single Shot MultiBox Detector，是Wei Liu在ECCV 2016上提出的一种目标检测算法。使用Nvidia Titan X在VOC 2007测试集上，SSD对于输入尺寸300x300的网络，达到74.3%mAP(mean Average Precision)以及59FPS；对于512x512的网络，达到了76.9%mAP ，超越当时最强的Faster RCNN(73.2%mAP)。具体可参考论文^[1]。
SSD目标检测主流算法分成可以两个类型：

two-stage方法：RCNN系列

通过算法产生候选框，然后再对这些候选框进行分类和回归。
one-stage方法：YOLO和SSD

直接通过主干网络给出类别位置信息，不需要区域生成。

SSD是单阶段的目标检测算法，通过卷积神经网络进行特征提取，取不同的特征层进行检测输出，所以SSD是一种多尺度的检测方法。在需要检测的特征层，直接使用一个3 $\times$ 3卷积，进行通道的变换。SSD采用了anchor的策略，预设不同长宽比例的anchor，每一个输出特征层基于anchor预测多个检测框（4或者6）。采用了多尺度检测方法，浅层用于检测小目标，深层用于检测大目标。SSD的框架如下图：

SSD-1

模型结构

SSD采用VGG16作为基础模型，然后在VGG16的基础上新增了卷积层来获得更多的特征图以用于检测。SSD的网络结构如图所示。上面是SSD模型，下面是YOLO模型，可以明显看到SSD利用了多尺度的特征图做检测。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

明志刘明 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。