YOLO1-YOLO5检测头的改进

最新推荐文章于 2025-06-26 20:55:23 发布

原创最新推荐文章于 2025-06-26 20:55:23 发布 · 7k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #深度学习 #算法

算法同时被 3 个专栏收录

33 篇文章

订阅专栏

计算机视觉

18 篇文章

订阅专栏

3 篇文章

订阅专栏

本文详细解析了YOLO目标检测算法从YOLO1至YOLO5的迭代进化过程，包括模型结构改进、检测精度提升及优化策略。如YOLO2引入passthrough层，YOLO3实现多尺度检测，YOLO4采用多锚框策略，YOLO5实施自适应anchor等创新。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

YOLO1：

最后检测头7*7grid,每个点预测两个框(一个大框一个小框)，分类用one hot，如下图所示：

YOLO2:

增加了一个中间卷积层，先采用64个 1*1 卷积核进行卷积，然后再进行passthrough处理，这样26*26*512的特征图得到13*13*256的特征图。

passthrough层的来源（细粒度特征）：上图中第25层route 16，意思是来自16层的output，即26*26*512。

passthrough层的处理：

利用1*1*64卷积降低第25层26*26*512（实际来自16层）的通道数，从512降低到64，输出26*26*64（见第26层）。

第27层进行拆分（实际的passthrough层）操作，1拆4分成13*13*256。

将passthrough层和最后一层卷积层结合：第28层叠加27层和24层的输出（13x13x1024+13x13x256），得到13*13*1280。

7*7 grid 太小了，增大为13*13
每个grid对应两个人为设计的anchor增加为5个统计得到的anchor（在voc2007和coco上都进行了统计，coco相比voc小框更多）
每个anchor对应一个类别，13*13*(5*5+5*20)=422500 outputs
损失函数gt为1变与iou计算的值
passthrough

YOLO3:

分为3个检测头分别检测大目标中目标和小目标，每个检测头预测3个人为设计的anchor

YOLO4:

Using mutlti-anchors for single ground truth

anchor与ground truth IOU大于阈值的框在损失函数计算时，使用的c用IOU值

Eliminate_grid_sensitivity

因为yolo3中使用了基于base anchor的策略限制了预测框中心点的位置必须在grid方框内部，这样会忽略中心点落在grid边界的情况，在前面增加系数，比如说1.1，填补这部分空缺的可能性。

CIOU loss

YOLO5:

自适应anchor：

基于人工定义的anchor，网络对anchor再次计算。先定义前景背景，然后进行精细化分类和回归，相当于two stage检测模型。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。