监督学习和kNN分类初学者教程

最新推荐文章于 2021-11-01 10:03:25 发布

原创

最新推荐文章于 2021-11-01 10:03:25 发布 · 2.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文是针对监督学习初学者的kNN分类器教程，通过Python的Scikit-learn库实现。介绍了监督学习的基本概念，数据的加载和理解，k-近邻算法的原理和应用。文章详细展示了如何构建和评估kNN模型，探讨了过拟合和欠拟合的概念，并通过调整邻居数找到最佳模型性能。最后，鼓励读者继续探索深度学习的世界。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者|Behic Guven 编译|VK 来源|Towards Data Science

在这篇文章中，我将向你介绍一种称为监督学习的机器学习方法。我将向你展示如何使用Scikit-learn构建kNN分类器模型。

这将是一个实践演练，我们将能够在实践知识的同时学习。作为我们的分类器模型，我们将使用k-NN算法模型，这将在引言部分进行更多介绍。作为编程语言，我们将使用Python。

阅读本教程后，你将更好地了解深度学习和监督学习模型的工作原理。

目录

监督学习
库
了解数据
kNN分类器模型
过拟合与欠拟合
结论

监督学习

深度学习是一门科学，它使计算机能够在没有明确编程的情况下从数据中得出结论。比如学会预测电子邮件是否是垃圾邮件。另一个很好的例子是通过观察花的图片将它们分为不同的类别。

在监督学习中，数据分为两部分：特征和目标变量。任务是通过观察特征变量来预测目标变量。监督学习可用于两种不同的模型：分类和回归

当目标变量是分类数据集时，可以使用分类模型。

当目标变量是连续值时，使用回归模型。

库

在这一步中，我们将安装本教程所需的库。正如引言中提到深度学习lib库的主要知识库。除此之外，我们将安装两个简单的库，它们是NumPy和Matplotlib。使用PIP（python包管理器）可以很容易地安装库。

安装库

进入终端窗口，开始安装过程：

pip install scikit-learn

现在让我们安装其他两个库：

pip install numpy matplotlib

导入库

很完美！现在让我们将它们导入到我们的程序中，以便使用它们。我将在本教程中使用Jupyter Notebook。因此，我创建了一个新的Notebook并导入了以下库模块。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。