深度学习PyTorch：卷积神经网络详解与操作实践

PDF文件

923KB | 更新于2024-08-30 | 137 浏览量 | 举报收藏

立即下载

在"ElitesAI·动手学深度学习PyTorch版-第二次打卡task03"中，主要内容围绕卷积神经网络的基础概念展开。首先，卷积神经网络（Convolutional Neural Networks, CNNs）的核心组成部分是二维卷积操作。二维互相关运算利用一个二维卷积核（filter或kernel）与输入的二维数组进行操作，通过在输入上滑动核并进行元素乘法和求和，生成输出特征图。卷积核通常是较小的，如2x2大小，其移动步长为1，会根据这些参数调整输出的尺寸，例如3x3输入和2x2核会产生2x2的输出。卷积层的名称源于传统意义上的卷积运算，但实际上在深度学习中，卷积层使用的是互相关运算。这个过程涉及核数组的翻转，尽管如此，由于卷积核是可学习的，互相关和卷积在实现上并无根本差异。特征图（Feature Maps）是卷积层输出的关键概念，它代表了输入在空间维度上的抽象表示，能够捕捉输入中的不同特征。感受野（Receptive Field）指的是影响输出元素的所有可能输入区域，随着网络深度增加，感受野的范围也会扩大，有助于识别更复杂的图像特征。填充（Padding）技术用于保留边缘信息，防止在卷积过程中边缘像素丢失，通过在图像周围添加额外的像素，确保卷积后的输出保持与原始输入相同的尺寸。步幅（Stride）则控制了卷积核在输入上的移动距离，可以改变输出特征图的分辨率。此外，卷积层支持多输入通道，即一个输入可以包含多个颜色通道（如RGB图像有3个通道），每个通道对应不同的特征。输出通道数则是指卷积层生成的不同特征图的数量，这在后续的网络结构中具有重要作用，比如用于分类任务的不同类别特征提取。理解这些基础概念对于深入学习和构建卷积神经网络至关重要，它们构成了深度学习中处理图像数据的基本框架，是构建现代计算机视觉系统的基础。通过实际操作和实践，学习者可以更好地掌握这些概念，并将其应用到实际项目中。

ElitesAI·动手学深度学习动手学深度学习PyTorch版版-第二次打卡第二次打卡task03

1、卷积神经网络基础：、卷积神经网络基础：

1.1 二维卷积操作：二维卷积操作：

二维互相关（cross-correlation）运算的输入是一个二维输入数组和一个二维核（kernel）数组，输出也是一个二维数组，其中核数组通常称为卷积核或过滤器（filter）。卷积核的尺

寸通常小于输入数组，卷积核在输入数组上滑动，在每个位置上，卷积核与该位置处的输入子数组按元素相乘并求和，得到输出数组中相应位置的元素。图1展示了一个互相关运算

的例子，阴影部分分别是输入的第一个计算区域、核数组以及对应的输出。

其中。卷积核为2✖2.输入为3×3，步长为1，所以得到的输出为2×2.

卷积层得名于卷积运算，但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组上下翻转、左右翻转，再与输入数组做互相关运算，这一过程就是卷积运算。由于卷积层的

核数组是可学习的，所以使用互相关运算与使用卷积运算并无本质区别。

1.2 特征图与感受野特征图与感受野

二维卷积层输出的二维数组可以看作是输入在空间维度（宽和高）上某一级的表征，也叫特征图（feature map）（简单来说就是通过卷积得到的结果向量简单来说就是通过卷积得到的结果向量）

影响元素的前向计算的所有可能输入区域（可能大于输入的实际尺寸）叫做的感受野（receptive field）（简单来说就是卷积操作的输入的所有向量简单来说就是卷积操作的输入的所有向量）

以上图为例，输入X中阴影部分的四个元素是输出Y中阴影部分元素的感受野。我们将图中形状为2×2的输出记为Y，将与另一个形状为2×2的核数组做互相关运算，输出单个元素Z。

那么，Z在Y上的感受野包括Y的全部四个元素，在输入上的感受野包括其中全部9个元素。可见，我们可以通过更深的卷积神经网络使特征图中单个元素的感受野变得更加广阔，从

而捕捉输入上更大尺寸的特征。

1.3 填充（填充（padding）和步幅（）和步幅（stride））

填充就是在进行卷积运算之后，都会对输入进行降维，但是有时候图像的边缘信息同样很重要，所以我们需要使用padding的技术。也就是保证边缘信息。对图像周围像素进行扩充

补0操作，使得卷积操作之后维度仍然与图片原尺寸一致。

通过这种填充可知，我们可以通过通过这种填充可知，我们可以通过

padding

和和

stride

将输出将输出

图片的尺寸变换为许多指定尺寸的输出。图片的尺寸变换为许多指定尺寸的输出。

1.4 多输入通道和多输出通道多输入通道和多输出通道

多输入通道多输入通道

卷积层的输入可以包含多个通道，图4展示了一个含2个输入通道的二维互相关计算的例子。

注意：只有在最后一层和全连接层连接时，才会将所有的卷积核得到的值相加（这一句有一些表述不当，等我什么时候再做修改）

1.5 卷积核为卷积核为1

下载后可阅读完整内容，剩余4页未读，继续阅读

开通会员，免费下载（低至0.43元/天)

成为会员后, 你将解锁

下载资源随意下

优质VIP博文免费学

优质文库回答免费看

付费资源9折优惠

weixin_38718262

粉丝: 9

深度学习PyTorch：卷积神经网络详解与操作实践

ElitesAI·动手学深度学习PyTorch版Task05打卡

ElitesAI·动手学深度学习PyTorch版TASK3、4、5

动手学深度学习（Pytorch版）task3-5打卡

《动手学深度学习PyTorch版》打卡_Task3，过拟合，欠拟合，梯度消失，梯度爆炸

《动手学深度学习PyTorch版》打卡_Task4，机器翻译及相关技术，注意力机制与Seq2seq模型

动手学深度学习pytorch版本

动手深度学习(Pytorch)之路—第二次打卡

Pytorch学习第二次打卡

《动手学深度学习》第二次打卡-学习小队

Datawhale&kesci&伯禹教育-深度学习-第二次打卡2梯度消失和爆炸

动手学pytorch-打卡3

动手学Pytorch-打卡2

Datawhale&kesci&伯禹教育-深度学习-第二次打卡1 过拟合&欠拟合的解决方法

Learn_Dive-into-DL-PyTorch 第二次打卡

深度学习PyTorch实践打卡（二）

CentOS7的网络设置

validation-api-1.1.0.Beta4.jar中文文档.zip

最新资源