CNN--各层的介绍_mean层-CSDN博客

本文介绍了卷积层的工作原理，包括输入尺寸、滤波器大小、输出尺寸的计算公式，以及多通道卷积的计算方法。此外，还详细解释了填充Padding的作用，用于保持图像尺寸不变。同时，讨论了池化层的功能，如Max池化和Mean池化，用于减小特征尺寸并增强模型的鲁棒性。这些基础知识是理解深度学习模型，尤其是卷积神经网络(CNN)的关键。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积层Convolutional

给定卷积核，将卷积核应用于输入图片特征的对应维度的地方，计算乘积，下图以步长stride=1为例，得到最终输出层特征。

There are an input image (left), a filter (middel), and an output image (right).

Convolution step by step

假设输入大小为(H,W)，滤波器大小为(FH,FW),输出大小为(OH,OW),填充padding为P,步幅stride为S
$OH=\frac{H+2P-FH}{S}+1\\ OW=\frac{W+2P-FW}{S}+1$
对于多通道卷积计算，类似于单通道计算方法，只是将每个通道计算值最后相加

在这里插入图片描述

多个卷积核的卷积运算：

在这里插入图片描述

填充Padding

在每次进行卷积后，输出维度缩小，根据输入图像的大小，几轮卷积之后输出图像的维度可能变得太小，同时边缘的像素点少于中间的像素点，这也因此忽略了图像的部分数据，为了解决这个问题，Padding通过在边缘填充数据，达到保持输入输出图片维度一致效果。

Padding Layer

池化层Pooling

池化层来减小特则行数据的大小，并使某些特征检测更加具有鲁棒性。如果使用一个 $4×44\times4$ 的矩阵，Max池化层和Mean池化层分别进行处理后的结果如下所示，这个过程很简单。在示例中，filter是2×2，stride为 2，因此将输入分成四份 $2×22\times2$ 的子区域，Max和Mean则是分别输出对应子区域的最大值和均值