pytorch的nn.Conv2d()参数及尺寸计算详解（与Tensorflow.nn.Conv2d相比）

最新推荐文章于 2025-07-11 15:21:10 发布

CV干饭王

最新推荐文章于 2025-07-11 15:21:10 发布

阅读量1.6w

点赞数 16

CC 4.0 BY-SA版权

分类专栏：库函数详解网络搭建文章标签： tensorflow pytorch 深度学习

本文链接：https://blog.csdn.net/weixin_44414948/article/details/110007392

参数详解

in_channels,
#输入数据的通道数（如彩色图片，一般为3）
out_channels,
#输出数据的通道数（就是我想让输出多少通道，就设置为多少）
kernel_size,
#卷积核的尺寸（如（3，2），3与（3,3）等同）
stride = 1,
#卷积步长，就是卷积操作时每次移动的格子数
padding = 0,
#原图周围需要填充的格子行（列）数，无填充的话卷积到边缘会直接忽略该边缘
dilation = 1,
#空洞卷积的空洞指数，一般默认为1即可
groups = 1,
#分组卷积的组数，一般默认设置为1，不用管
bias = True,
#卷积偏置，一般设置为False，True的话可以增加模型的泛化能力
padding_mode = 'zeros’
#设置边缘填充值为0，或别的数，一般都默认设置为0

torch.nn.Conv2d(    in_channels,  #输入数据的通道数（如彩色图片，一般为3）
					out_channels,

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CV干饭王

关注关注

16
点赞
踩
42

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pytorch之torch.nn.Conv2d()函数详解

夏普通

07-09

21万+

文章目录一、官方文档介绍二、torch.nn.Conv2d()函数详解参数详解参数dilation——扩张卷积（也叫空洞卷积）参数groups——分组卷积三、代码实例一、官方文档介绍官网 nn.Conv2d：对由多个输入平面组成的输入信号进行二维卷积二、torch.nn.Conv2d()函数详解参数详解 torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=

torch.nn.Conv2d参数

Lison_Zhu's Blog

09-04

3296

torch.nn.Conv2d 　　用于搭建卷积神经网络的卷积层，主要的输入参数有输入通道数、输出通道数、卷积核大小、卷积核移动步长和Padding的值。其中，输入通道数的数据类型是整型，用于确定输入数据的层数；输出通道数的数据类型也是整型，用于确定输出数据的层数；卷积核大小的数据类型是整型，用于确定卷积核的大小；卷积核移动步长的数据类型是整型，用于确定卷积核每次滑动的步长；Paddingde ...

参与评论您还未登录，请先登录后发表或查看评论

nn.Conv2d参数详解及输入特征图尺寸的计算

蜗牛在奔跑的博客

05-06

1万+

kernel_size：卷积核的大小，通常为正方形，可以是单个整数表示正方形大小，也可以是一个元组（tuple）表示不同宽度和高度的大小，如 (3, 5) 表示宽度为 3 个像素，高度为 5 个像素的卷积核；需要注意的是，卷积层的参数选择也会影响特征图的大小。比如，在使用大尺寸的卷积核进行卷积时，会使得特征图的尺寸减小，而使用小尺寸的卷积核则会使得特征图的尺寸增加。其中，W 表示输入特征图的宽度，H 表示输入特征图的高度，K 表示卷积核的大小，P 表示 padding 的大小，S 表示卷积核的步幅。

[面试经验] 深度学习-1-pytorch的conv2d函数

热门推荐

落地生根

03-09

12万+

学习torch框架中的卷积神经网络，对此进行记录一、nn.Conv2d nn.Conv2d(self, in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)) 参数： in_channel:输入数据的通道数，例RGB图片通道数为3； out_channel: 输...

pytorch1.0中torch.nn.Conv2d用法详解

09-18

在PyTorch 1.0中，`torch.nn.Conv2d`是用于执行二维卷积操作的核心模块。它是深度学习模型，尤其是计算机视觉任务中不可或缺的一部分。本文将深入讲解`nn.Conv2d`的主要功能、参数及其用法。首先，`nn.Conv2d`的...

PyTorch学习之torch.nn.Conv2d函数

qq_46396470的博客

06-30

3588

是 PyTorch 中用于实现二维卷积层的类，这个类可以说是对的进一步封装，使其使用起来更加的傻瓜式。

深入理解卷积函数torch.nn.Conv2d的各个参数以及计算公式（看完写模型就很简单了）

weixin_44162814的博客

05-10

5790

上面修改第二层Conv2d()的输出通道数参数，改为164，发现最后输出结果output1也只是输出通道数目（也就是一个像素点用多少数字表示）变化，其他三个参数都没变。Hout公式代入：18 = [32+2x4-1x(5-1)-1]/2+1结果再向下取整（也就是35/2+1向下取整 = 18）也就是修改的是torch.randn(10, 3, 32, 32)里面的3。也就是修改的是torch.randn(10, 3, 32, 32)里面的32x32。输出结果：torch.Size([10, 164,

pytorch nn.conv2d参数个数计算

probie的博客

03-12

4682

nn.conv2d(256, 256, 3, 3) 假设输入大小为[3, 128, 128],输出的大小则为128-3+1=126，这一层参数个数为256*3*3+256=2560. 假设输入尺寸为[C_in, H, W]，则输出大小计算公式为[C_out, (H-K+2*P)/S+1, (W-K+2*P)/S+1]。其中C_in是输入通道数，H，W是数据的尺寸，K是核大小，P是padding大小，S是步长stride大小。 nn.conv2d(C_in, C_out, K, K)参数个数的计算公式为C_

nn.Conv2d()方法详解

weixin_41917928的博客

06-15

5318

方法是PyTorch中用于卷积操作的方法。它具有多个参数，包括输入通道数、输出通道数、卷积核大小、步长、填充大小、扩张率、分组数、偏置和填充模式。在使用方法时，需要根据具体任务和数据的特点来选择合适的参数。

【PyTorch】nn.Conv2d函数详解

See_Star的博客

10-27

3万+

【PyTorch】nn.Conv2d函数详解

Conv2d参数详解

weixin_43845922的博客

06-07

3748

深度学习

tf.nn.conv2d（）参数说明

qq_30934313的博客

01-24

2万+

tf.nn.conv2d用法详解 tf.nn.conv2d() 我们已经知道这个函数是用于做二维卷积的，但是他容易和tf.layers.conv2d()混淆。对于初学者来说，他的参数也不是那么容易理解，只是了解到一点皮毛，并不能一下子就记住。下面我们来看一下他定义时的参数： def conv2d(input, # 张量输入 filter, # 卷积核参数 strides, # 步...

【PyTorch基础】——nn.Conv2d（）参数设置

retainenergy的博客

12-03

3777

nn.Conv2d(）参数设置 bias什么时候设置为True?什么时候设置为False？

Pytorch的nn.Conv2d（）参数详解

Akita·Wang's Semantic Segmentation

04-12

6万+

nn.Conv2d()的使用、形参与隐藏的权重参数二维卷积应该是最常用的卷积方式了，在Pytorch的nn模块中，封装了nn.Conv2d()类作为二维卷积的实现。使用方法和普通的类一样，先实例化再使用。下面是一个只有一层二维卷积的神经网络，作为nn.Conv2d（）方法的使用简介： class Net(nn.Module): def __init__(self): nn.Module.__init__(self) self.conv2d = nn..

nn.Conv2d 参数详解

06-17

### PyTorch中 `nn.Conv2d` 参数详解 #### 1. 参数含义 `nn.Conv2d` 是 PyTorch 中用于实现二维卷积操作的模块。以下是其主要参数的详细解释： - **in_channels**: 输入张量的通道数，表示输入图像或特征图的深度[^3]。 - **out_channels**: 输出张量的通道数，即卷积层输出的特征图数量，通常与卷积核的数量一致[^3]。 - **kernel_size**: 卷积核的大小，可以是一个整数（表示方形卷积核）或一个元组（表示非方形卷积核）。例如，`kernel_size=3` 表示 \(3 \times 3\) 的卷积核，而 `kernel_size=(3, 5)` 表示 \(3 \times 5\) 的卷积核[^1]。 - **stride**: 卷积核在输入上滑动的步幅，默认值为 1。较大的步幅会减少输出的空间尺寸[^1]。 - **padding**: 在输入边界添加的零填充量。默认值为 0，表示不进行填充。如果设置为 1，则会在输入的每个维度上增加一行/列的零填充[^2]。 - **dilation**: 卷积核元素之间的间距。默认值为 1，表示标准卷积。当 dilation 大于 1 时，称为扩张卷积或空洞卷积。 - **groups**: 控制输入和输出之间的连接方式。默认值为 1，表示所有输入通道都参与卷积运算。如果设置为输入通道数，则表示分组卷积，每组独立计算[^1]。 - **bias**: 是否为卷积层添加偏置项。默认值为 True，表示添加偏置[^1]。 - **padding_mode**: 指定填充的方式。可选值包括 `'zeros'`（零填充）、`'reflect'`（反射填充）、`'replicate'`（复制边缘值填充）和 `'circular'`（循环填充），默认为 `'zeros'`[^2]。 #### 2. 示例代码以下是一个简单的代码示例，展示如何使用 `nn.Conv2d`： ```python import torch import torch.nn as nn # 定义卷积层 conv_layer = nn.Conv2d(in_channels=1, out_channels=4, kernel_size=3, stride=1, padding=1) # 创建一个输入张量 (batch_size=1, channels=1, height=5, width=5) input_tensor = torch.randn(1, 1, 5, 5) # 应用卷积操作 output_tensor = conv_layer(input_tensor) print("Input Tensor Shape:", input_tensor.shape) print("Output Tensor Shape:", output_tensor.shape) ``` 运行上述代码后，`output_tensor` 的形状将是 `(1, 4, 5, 5)`。这是因为通过设置 `padding=1`，输入张量的高度和宽度保持不变，同时生成了 4 个输出通道[^3]。 #### 3. 计算公式对于输入张量形状为 \(N \times C_{\text{in}} \times H_{\text{in}} \times W_{\text{in}}\)，经过卷积操作后，输出张量的形状为 \(N \times C_{\text{out}} \times H_{\text{out}} \times W_{\text{out}}\)，其中： \[ H_{\text{out}} = \left\lfloor \frac{H_{\text{in}} + 2 \cdot \text{padding} - \text{dilation} \cdot (\text{kernel_size} - 1) - 1}{\text{stride}} + 1 \right\rfloor \] \[ W_{\text{out}} = \left\lfloor \frac{W_{\text{in}} + 2 \cdot \text{padding} - \text{dilation} \cdot (\text{kernel_size} - 1) - 1}{\text{stride}} + 1 \right\rfloor \] #### 4. 注意事项 - 如果需要保留输入张量的空间尺寸不变，可以通过设置 `padding` 为 \(\frac{\text{kernel_size} - 1}{2}\) 来实现（前提是 `kernel_size` 为奇数）[^1]。 - 当 `groups=in_channels=out_channels` 时，表示深度可分离卷积（Depthwise Convolution）[^1]。 - 在实际应用中，`nn.Conv2d` 常与其他层（如激活函数、池化层等）结合使用，以构建复杂的神经网络模型。