对CNN中pooling层（池化层）的理解

最新推荐文章于 2025-07-05 09:00:00 发布

转载最新推荐文章于 2025-07-05 09:00:00 发布 · 9.9k 阅读

·

4

·

文章标签：

深度学习专栏收录该内容

7 篇文章

订阅专栏

本文详细介绍了卷积神经网络(CNN)中的池化层，包括池化层的作用、mean-pooling与max-pooling的工作原理及反向传播过程，并提供了Caffe中池化层的配置示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

自己在学习CNN过程中,查找网上一些资料,对pooling层有了一些理解,记录下来,也供大家参考:

pooling层(池化层)的输入一般来源于上一个卷积层,主要有以下几个作用:

1.保留主要的特征,同时减少下一层的参数和计算量，防止过拟合

2. 保持某种不变性，包括translation(平移)，rotation(旋转)，scale(尺度),常用的有mean-pooling和max-pooling

mean-pooling(平均值)

对一块小区域取平均值,假设pooling的窗大小是2x2,

1.forward:就是在前面卷积层的输出的不重叠地进行2x2的取平均值降采样，就得到mean-pooling的值。举例:

2x2区域取平均值

不重叠的4个2x2区域分别mean-pooling

2.backward:把一个值分成四等分放到前面2x2的格子区域里面就好了。举例:

四等分(2/4= 1/2) 放到2x2的区域

四个值分别Backword

max-pooling(最大值)

即对一小块区域取最大值,假设pooling的窗大小是2x2,

1.forward:就是在前面卷积层的输出的不重叠地进行2x2的取最大值降采样，就得到max-pooling的值。举例:

2x2区域取最大值

不重叠的4个2x2区域分别max-pooling

2.backward:在max-pooling前向传播时,只取最大值,其他值无作用.

因此反向传播时，只关注最大值，所以将残差传递到该最大值的位置，区域内其他2*2-1=3个位置置零

四个值分别Backward

Caffe中池化层的配置

池化层的配置信息如下：

1

2

3

4

5

6

7

8

9

10

11

layer {

name: 'pool1'

bottom: 'conv1_2'

top: 'pool1'

type: "Pooling"

pooling_param {

pool: MAX

kernel_size: 2

stride: 2

}

}

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。