python手写数字识别实验报告_机器学习python实战之手写数字识别

最新推荐文章于 2022-01-05 09:39:50 发布

最新推荐文章于 2022-01-05 09:39:50 发布 · 2.2k 阅读

·

1

·

文章标签：

#python手写数字识别实验报告

本文介绍了使用Python进行手写数字识别的实验，通过K近邻算法将二值图转换为1*1024向量，训练和测试数据集分别来自trainingDigits和testDigits文件夹。经过训练和测试，模型在946个测试样本中出现10个错误，误差率为1%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

看了上一篇内容之后，相信对K近邻算法有了一个清晰的认识，今天的内容——手写数字识别是对上一篇内容的延续，这里也是为了自己能更熟练的掌握k-NN算法。

我们有大约2000个训练样本和1000个左右测试样本，训练样本所在的文件夹是trainingDigits，测试样本所在的文件夹是testDigits。文本文件中是0~9的数字，但是是用二值图表示出来的，如图。我们要做的就是使用训练样本训练模型，并用测试样本来检测模型的性能。

首先，我们需要将文本文件中的内容转化为向量，因为图片大小是32*32，所以我们可以将其转化为1*1024的向量。具体代码实现如下：

def img2vector(filename):

imgVec = zeros((1,1024))

file = open(filename)

for i in range(32):

lines = file.readline()

for j in range(32):

imgVec[0,32*i+j] = lines[j]

return imgVec

实现了图片到向量的转化之后，我们就可以对测试文件中的内容进行识别了。这里的识别我们可以使用上一篇中的自定义函数classify0，这个函数的第一个参数是测试向量，第二个参数是训练数据集，第三个参数是训练集的标签。所以，我们首先需要将训练数据集转化为(1934*1024)的矩阵，1934这里是训练集的组数即trainingDigits目录下的文件数，其对应的标签转化为(1*1934)的向量。之后要编写的代码就是对测试数据集中的每个文本文件进行识别，也就是需要将每个文件都转化成一个(1*1024)的向量，再传入classify0函数的第一个形参。整体代码如下：

def handWriteNumClassTest():

NumLabels = []

TrainingDirfile = listdir(r

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。