深度学习目标检测笔记

最新推荐文章于 2024-10-10 14:49:47 发布

cycyco

最新推荐文章于 2024-10-10 14:49:47 发布

阅读量242

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_38591130/article/details/105818473

深度学习专栏收录该内容

12 篇文章

订阅专栏

本文全面概述深度学习中目标检测技术的发展，从经典两阶段检测器如R-CNN、Fast R-CNN到单阶段检测器YOLO、SSD，再到最新的Mask R-CNN和RetinaNet。详细解析了卷积神经网络在检测中的应用，包括卷积、池化、特征金字塔等关键概念。同时介绍了模型微调、数据增强和评估指标等实用技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目标检测

卷积

输入形状是 nh×nw ，卷积核窗口形状是 kh×kw ，那么输出形状将会是
(nh−kh+1)×(nw−kw+1).
padding填充p，则输出长度+p
stride：当高上步幅为 sh ，宽上步幅为 sw 时，输出形状为⌊(nh−kh+ph+sh)/sh⌋×⌊(nw−kw+pw+sw)/sw⌋.

图像增广

微调

在源数据集（如ImageNet数据集）上预训练一个神经网络模型
创建目标模型复制了源模型上除了输出层外的所有模型设计及其参数
训练目标模型
当目标数据集远小于源数据集时，微调有助于提升模型的泛化能力。

两阶段

R-CNN

生成候选区域
selective search：
分割成矩形框→合并→不同大小的候选区域缩放到相同大小得到定长向量
CNN提取特征
预训练不带框
微调（fine-tuning)带框标注（可选）
对区域分类
分类：线性SVM、softmax
边框较准：线性回归。输入特征（？

特点：在特征提取时间最长，扩展类别时间没有上升

SPP-net

空间金字塔池化
不需要每个候选区域单独通过网络

Fast R-CNN

单尺度Rol Pooling
多任务学习
全连接层SVD加速

生成候选区域：selective search、Edge Box（快）
Fast RCNN用CNN生成候选窗口-Region Proposal Network（RPN）：
两网络共享卷积层（Alex、VGG、ResNet）
anchor box ：不同长宽比大小窗口
模型训练：交替、端到端（两个监督）