目标检测算法综述

最新推荐文章于 2024-07-29 21:13:42 发布

qingtian_111

最新推荐文章于 2024-07-29 21:13:42 发布

阅读量472

点赞数 3

CC 4.0 BY-SA版权

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qingtian_111/article/details/88901435

目标检测专栏收录该内容

2 篇文章

订阅专栏

本文综述了目标检测的概念，对比了传统方法与深度学习方法的差异，并深入解析了two-stage（如R-CNN系列）和one-stage（如YOLO、SSD）算法的工作原理，包括RPN网络和NMS非极大值抑制算法的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目标检测算法综述：

1.引言

1）目标检测可理解为物体识别和物体定位的总和，即要识别物体属于哪个分类以及得到物体在图片中的具体位置；

2）目标检测模型分为两类：一类为two-stage，将物体识别与物体定位分两个步骤（典型代表：R-CNN、fast R-CNN、faster-RCNN）；另一类为one-stage，典型代表有Yolo、SSD、YoloV2等.

2.传统的和基于深度学习的目标检测方法对比：

传统的目标检测方法
- 手动设计特征
- 滑动窗口
- 传统分类器
- 多步骤
- 准确度和实时性差
基于深度学习的目标检测方法
- 深度网络学习特征
- Proposal或者直接回归
- 深度网络
- 端到端
- 准确度高和实时性好

3.解释一些名词与算法

two-stage:

主要通过一个卷积神经网络来完成目标检测过程，提取的是CNN卷积特征。

训练网络主要训练两个部分：第一步训练RPN网络（详情可见下方）；第二步训练目标区域检测的网络。

其优缺点在于：网络的准确度高、速度相对one-stage慢。

Two-stage目标检测网络基本流程：（借鉴博客：https://blog.csdn.net/gaoyu1253401563/article/details/86485851）
流程分析：

1）输入一张图片后，经过卷积神经网络，对图片进行深度特征提取（此卷积神经网络为主干网络，可以使用VGGNet、ResNet、Zenet等经典的神经网络结构）；

2）通过RPN网络来完成候选区域产生的操作，同时完成区域的分类（将图片分为背景和目标两种类别），并对目标的位置进行初步预测；

3）通过Roi_pooling层对候选区域中的位置进行精确定位于修正（可理解成抠图的操作）；

4）将抠图所得到的候选目标对应到特征图（feature map）上相应的特征区域，再经过全连接层（fc），得到相应的特征向量；

5）最后通过分类与回归两个分支实现候选目标类别的判定和目标位置的确定，即最后矩形框的四个点的坐标（x,y,w,h），该坐标中（x,y）为左上角顶点的坐标，w,h对应的是矩形框的长和宽。

one-stage:

直接回归出目标框的位置，即不用产生候选框，直接将目标边框定位的问题转化成回归问题。

来自博客的图片：https://blog.csdn.net/gaoyu1253401563/article/details/86477942

RPN网络：

——区域生成网络（Faster R-CNN核心）

RPN的本质是 “ 基于滑窗的无类别obejct检测器 ”

参考链接有：https://blog.csdn.net/JNingWei/article/details/78847696

https://blog.csdn.net/u012426298/article/details/81517609

https://blog.csdn.net/emiedon/article/details/79669303（通俗理解）

里面涉及到anchor，对于anchor的理解可以参考链接：https://blog.csdn.net/as472780551/article/details/81227408

NMS(非极大值抑制算法)

——对目标框（候选框）的合并

为了消除多余的检测框，找到最佳的物体检测的位置。

https://blog.csdn.net/gaoyu1253401563/article/details/86483446（讲得很详细）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。