mnist识别python代码（基于tensorflow）_MNIST数据集资源-CSDN下载

共5个文件

pyc：3个

py：2个

mnist

tensorflow

数据增强

模型保存恢复

需积分: 10 90 浏览量 2017-12-30 19:28:14 上传评论 1 收藏 5KB 7Z 举报

在本项目中，我们主要探讨的是使用Python编程语言和TensorFlow框架进行手写数字识别的任务。MNIST数据集是这个领域的一个经典基准，它包含了60,000个训练样本和10,000个测试样本，每个样本都是28x28像素的灰度图像，代表0到9的手写数字。以下将详细讲解如何利用TensorFlow构建一个卷积神经网络（CNN）模型来解决这个问题，并实现数据增强、模型保存和恢复功能。我们需要导入相关的库，包括TensorFlow、Numpy和Matplotlib等。TensorFlow是Google开发的深度学习框架，提供了丰富的API用于构建和训练神经网络。Numpy用于处理数据，而Matplotlib则用于可视化结果。数据预处理是任何机器学习任务的关键步骤。对于MNIST，我们需要加载数据，然后将其归一化到0到1之间。此外，为了增加模型的泛化能力，我们可以使用数据增强技术，如随机旋转、平移或翻转图像。这可以通过TensorFlow的`tf.image`模块实现。接下来，我们将构建CNN模型。CNN由卷积层、池化层和全连接层组成。卷积层用于提取特征，池化层降低维度，全连接层则用于分类。在本例中，可能的架构包括两个卷积层，每个后面跟一个最大池化层，最后是两个全连接层。激活函数通常选择ReLU，因为它可以避免梯度消失问题。损失函数通常选择交叉熵，优化器则可选择Adam，因为它对许多问题都有良好的表现。在训练过程中，我们需要定义训练和验证数据集，然后通过`model.fit()`方法进行训练。模型保存功能允许我们在训练过程中或训练后保存模型的权重，以便后续使用。这可以通过`model.save_weights()`实现。同时，我们还可以使用`model.load_weights()`恢复模型的权重，继续训练或进行预测。模型评估阶段，我们会用测试数据集计算模型的准确率。90行代码就能达到超过99%的准确率，表明这是一个高效的模型实现。为了进一步提升性能，可以尝试调整超参数，如学习率、批量大小或网络结构。这个项目展示了如何利用TensorFlow高效地处理图像识别任务，以及如何利用数据增强提高模型的泛化能力。同时，模型保存和恢复功能使得研究过程更加灵活，可以方便地继续之前的工作或者在不同环境下复用模型。通过理解并实践这个项目，开发者将对CNN、TensorFlow和MNIST数据集有更深入的理解。

资源推荐

资源详情

资源评论

收起资源包目录

mnist.7z （5个子文件）

mnist

ext_data.py 1KB

test.py 3KB

model

__pycache__

cnntest.cpython-36.pyc 2KB

lenet.cpython-36.pyc 3KB

ext_data.cpython-35.pyc 872B

MNIST_data

import tensorflow as tf import random from ext_data import * import scipy.io as sio from tensorflow.examples.tutorials.mnist import input_data # mnist数据集下载到此目录下 mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) # hyper parameters learning_rate = 0.002 training_epochs = 40 batch_size = 100 SAVE_MODEL_PATH = "model/save_net.ckpt" # input place holders X = tf.placeholder(tf.float32, [None, 784]) X_img = tf.reshape(X, [-1, 28, 28, 1]) # img 28x28x1 (black/white) Y = tf.placeholder(tf.float32, [None, 10]) drop_rate = tf.placeholder(tf.float32) W1 = tf.Variable(tf.random_normal([5, 5, 1, 6], stddev=0.01)) b1 = tf.Variable(tf.random_normal([6])) L1 = tf.nn.conv2d(X_img, W1, strides=[1, 1, 1, 1], padding='VALID') L1 = tf.nn.relu(L1 + b1) L1 = tf.nn.avg_pool(L1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME') W2 = tf.Variable(tf.random_normal([5, 5, 6, 16], stddev=0.01)) b2 = tf.Variable(tf.random_normal([16])) L2 = tf.nn.conv2d(L1, W2, strides=[1, 1, 1, 1], padding='VALID') L2 = tf.nn.relu(L2 + b2) L2 = tf.nn.avg_pool(L2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME') L2_flat = tf.reshape(L2, [-1, 4 * 4 * 16]) L2_drop = tf.nn.dropout(L2_flat,drop_rate) W3 = tf.Variable(tf.random_normal([4*4*16, 10], stddev=0.01)) b3 = tf.Variable(tf.random_normal([10])) logits = tf.matmul(L2_drop, W3) + b3 cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits( logits=logits, labels=Y)) optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost) #creat a saver saver = tf.train.Saver() # initialize with tf.Session() as sess: sess.run(tf.global_variables_initializer()) # train my model print('Learning started. It takes sometime.') for epoch in range(training_epochs): avg_cost = 0 total_batch = int(mnist.train.num_examples / batch_size) for i in range(total_batch): xs, ys = mnist.train.next_batch(batch_size) train_data = expend_training_data(xs, ys) batch_xs = train_data[:,0:784] batch_ys = train_data[:,784:] feed_dict = {X: batch_xs, Y: batch_ys, drop_rate:0.5} c, _ = sess.run([cost, optimizer], feed_dict=feed_dict) avg_cost += c / total_batch print('Epoch:', '%04d' % (epoch + 1), 'cost =', '{:.9f}'.format(avg_cost)) print('Learning Finished!') # save the model saver.save(sess,SAVE_MODEL_PATH) # Test model and check accuracy correct_prediction = tf.equal(tf.argmax(logits, 1), tf.argmax(Y, 1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) test_data = expend_training_data(mnist.test.images, mnist.test.labels) test_xs = test_data[:,0:784] test_ys = test_data[:,784:] print('Accuracy:', sess.run(accuracy, feed_dict={ X:test_xs , Y: test_ys, drop_rate:1}))

评论收藏

内容反馈