基于python开发的利用Alexnet实现MNIST+源码+开发文档+代码解析（毕业设计&课程设计&项目开发）

共5个文件

png：2个

py：1个

pdf：1个

版权申诉

毕业设计

python

Alexnet

MNIST

课程设计

5星 · 超过95%的资源 71 浏览量 2024-05-25 20:44:19 上传评论 1 收藏 1.75MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

Alexnet实现MNIST.zip （5个子文件）

CV-Alexnet-master

Alexnet.pdf 1.55MB

Alexnet_MNIST.py 5KB

images

1.png 264KB

2.png 136KB

README.md 12KB

Alexnet网络详解 ============== # 一. 简介 > AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后，更多的更深的神经网路被提出，比如优秀的vgg,GoogleLeNet。其官方提供的数据模型，准确率达到57.1%,top 1-5 达到80.2%。这项对于传统的机器学习分类算法而言，已经相当的出色。 # 二. 详解 > Alexnet模型采用的主要结构如下： ## (一) Relu > 标准CNN模型的激活函数常采用tanh函数，但是在进行梯度下降计算时，Relu函数的训练速度更快，错误率更低，因此论文采用了Relu作为神经元的激活函数。 ## (二) Local Response Normalization > 局部归一化，在Relu之后采用，主要为了提高模型的泛化能力。lrn层的公式如下，参数设置如下：k=2，n=5，α=10^(-4)，β=0.75。现在模型中更常用Batch Normalization。 ## (三) Overlapping Pooling > 重叠池化，传统CNN的pool层中，ksize和stride都相同，但论文训练发现，当stride<ksize时，模型更难过拟合，因此论文采用的maxpool层的参数设置为：ksize=3，stride=2 ## (四) Dropout > dropout层采用神经元丢弃策略，主要是为了避免模型过拟合，论文以0.5的概率对每个隐层神经元的输出设为0，那些“失活的”的神经元不再进行前向传播并且不参与反向传播。dropout在前两个全连接层中使用，非常有效避免了过拟合。 # 三. 网络结构 > 网络结构如图所示： ![image](https://github.com/ShaoQiBNU/Alexnet/blob/master/images/1.png) ![image](https://github.com/ShaoQiBNU/Alexnet/blob/master/images/2.png) # 四. 代码 > 采用Alexnet模型对MNIST数据集进行分类判别，由于MNIST影像大小为28 x 28，所以网络结构做了相应调整，从而适应数据，代码如下： > ## (一) 卷积 ```python ########## define conv process ########## def conv2d(name,x,W,b,strides=1, padding='SAME'): x=tf.nn.conv2d(x,W,strides=[1,strides,strides,1],padding=padding) x=tf.nn.bias_add(x,b) return tf.nn.relu(x,name=name) ``` ## (二) 池化 ```python ########## define pool process ########## def maxpool2d(name, x, k=3, s=2, padding='SAME'): return tf.nn.max_pool(x,ksize=[1,k,k,1],strides=[1,s,s,1],padding=padding,name=name) ``` ## (三) 规范化 ```python ########## define norm process ########## def norm(name, l_input, lsize=5): return tf.nn.lrn(l_input, lsize, bias=1.0, alpha=0.0001, beta=0.75, name=name) ``` ## (四) 卷积核参数 ```python ########## set net parameters ########## def weight_var(name, shape): return tf.get_variable(name=name, shape=shape, initializer=tf.contrib.layers.xavier_initializer()) def bias_var(name, shape): return tf.get_variable(name=name, shape=shape, initializer=tf.constant_initializer(0)) weights={ ## wc1 卷积核11*11*1*96，输入为28*28*1，所以in_channels=1,96代表卷积核个数，表示有96个11*11*1的卷积核 ## 'wc1': weight_var('wc1',[11,11,1,96]), ## wc2 卷积核5*5*96*256，输入为14*14*96，所以in_channels=96,256代表卷积核个数，表示有256个14*14*96的卷积核 ## 'wc2': weight_var('wc2',[5,5,96,256]), ## wc3 卷积核3*3*256*384，输入为7*7*256，所以in_channels=256,384代表卷积核个数，表示有384个7*7*256的卷积核 ## 'wc3': weight_var('wc3',[3,3,256,384]), ## wc4 卷积核3*3*384*384，输入为4*4*384，所以in_channels=384,384代表卷积核个数，表示有384个3*3*384的卷积核 ## 'wc4': weight_var('wc4',[3,3,384,384]), ## wc5 卷积核3*3*384*256，输入为4*4*384，所以in_channels=384,256代表卷积核个数，表示有256个3*3*384的卷积核 ## 'wc5': weight_var('wc5',[3,3,384,256]), ## wd1 2*2*256*4096，输入为2*2*256，所以将其展平则为1*(2*2*256),4096表示全连接层神经元的个数 ## 'wd1': weight_var('wd1',[4*4*256,4096]), ## wd2 4096*4096，输入为[2*2*256,4096]，4096表示有4096个神经元 ## 'wd2': weight_var('wd2',[4096,4096]), ## out 4096,10，输入为[4096,4096]，10表示有10类————> 0-9 ## 'out_w': weight_var('out_w',[4096,10]) } biases={ 'bc1': bias_var('bc1',[96]), 'bc2': bias_var('bc2',[256]), 'bc3': bias_var('bc3',[384]), 'bc4': bias_var('bc4',[384]), 'bc5': bias_var('bc5',[256]), 'bd1': bias_var('bd1',[4096]), 'bd2': bias_var('bd2',[4096]), 'out_b': bias_var('out_b',[n_classes]) } ``` ## (五) 网络结构 ```python ##################### build net model ########################## ########## define net structure ########## def alexnet(x, weights, biases, dropout): #### reshape input picture 输入数字是1*784的数据，将其reshape成28*28的影像 #### x=tf.reshape(x, shape=[-1,28,28,1]) #### 1 conv 第1层卷积 #### ## conv size变化为 28*28———> 28*28，ceil(28/1) ## conv1=conv2d('conv1', x, weights['wc1'], biases['bc1'], padding='SAME') ## pool size变化为 28*28———> 14*14，ceil(14/2) ## pool1=maxpool2d('pool1',conv1,k=3, s=2, padding='SAME') ## norm size变化为 14*14———> 14*14 ## norm1=norm('norm1', pool1, lsize=5) #### 2 conv 第2层卷积 #### ## conv size变化为 14*14———> 14*14 ，ceil(14/1) ## conv2=conv2d('conv2', norm1, weights['wc2'], biases['bc2'], padding='SAME') ## pool size变化为 14*14———> 7*7 ，ceil(14/2) ## pool2=maxpool2d('pool2',conv2,k=3, s=2, padding='SAME') ## norm size变化为 7*7———> 7*7 ## norm2=norm('norm2', pool2, lsize=5) #### 3 conv 第3层卷积 #### ## conv size变化为 7*7———> 7*7 ，ceil(7/1) ## conv3=conv2d('conv3', norm2, weights['wc3'], biases['bc3'], padding='SAME') #### 4 conv 第4层卷积 #### ## conv size变化为 7*7———> 7*7 ，ceil(7/1) ## conv4=conv2d('conv4', conv3, weights['wc4'], biases['bc4'], padding='SAME') #### 5 conv #### ## conv size变化为 7*7———> 7*7 ，ceil(7/1) ## conv5=conv2d('conv5', conv4, weights['wc5'], biases['bc5'], padding='SAME') ## pool size变化为 7*7———> 4*4 ，ceil(7/2) ## pool5=maxpool2d('pool5',conv5,k=3, s=2, padding='SAME') ## norm size变化为 7*7———> 7*7 ## norm5=norm('norm5', pool5, lsize=5) #### 1 fc 第1全连接层 'wd1': shape为4*4*256 #### fc1=tf.reshape(norm5,[-1,weights['wd1'].get_shape().as_list()[0]]) fc1=tf.add(tf.matmul(fc1,weights['wd1']),biases['bd1']) fc1=tf.nn.relu(fc1) ## dropout 丢弃层 ## fc1=tf.nn.dropout(fc1, dropout) #### 2 fc 第2全连接层 #### #fc2=tf.reshape(fc1,[-1,weights['wd2'].get_shape().as_list()[0]]) fc2=tf.add(tf.matmul(fc1,weights['wd2']),biases['bd2']) fc2=tf.nn.relu(fc2) ## dropout 丢弃层 ## fc2=tf.nn.dropout(fc2, dropout) #### output 输出层 #### out=tf.add(tf.matmul(fc2,weights['out_w']),biases['out_b']) return out ``` ## (六) 完整代码 ```python ########## load packages ########## import tensorflow as tf ##################### load data ########################## from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets("mnist_sets",one_hot=True) ########## set net hyperparameters ########## learning_rate=0.0001 epochs=20 batch_size=128 display_step=30 ########## set net parameters ########## #### img shape:28*28 n_input=784 #### 0-9 digits n_classes=10 #### dropout probability dropout=0.5 ########## placeholder ########## x=tf.placeholder(tf.float32,[None,n_input]) y=tf.placeholder(tf.float32,[None,n_classes]) ##################### build net model ########################## ########## define conv process ########## def conv2d(name,x,W,b,strides=1, padding='SAME'): x=tf.nn.conv2d(x,W,strides=[1,strides,strides,1],padding=padding) x=tf.nn.bias_add(x,b) return tf.nn.relu(x,name=name) ########## define pool process ########## def maxpool2d(name, x, k=3, s=2, padding='SAME'): return tf.nn.max_pool(x,ksize=[1,k,k,1],strides=[1,s,s,1],padding=padding,name=name) ########## define norm process ########## d

评论收藏

内容反馈

版权申诉