目标检测任务中,代码中的grid是什么?
grid可以从两个角度理解:
- grid真实的代表是预测特征层,每一个grid cell就代表特征层上的一个像素点。
- 在输入图像中打上grid网格,就代表每一个grid cell(预测特征层的像素点)对应原始图像上的感受野,也就是等比例缩放后的大小。
因此:
- 想要得到预测特征层的输出(bbox、cls和conf),只需要在grid上先通过一个3×3卷积,再通过一个1×1卷积即可。最后一个1×1卷积层的卷积个数为4+1+num_cls。
目标检测任务中,代码中的grid是什么?
grid可以从两个角度理解:
因此: