KNN算法

最新推荐文章于 2023-10-09 21:09:59 发布

大数据最好

最新推荐文章于 2023-10-09 21:09:59 发布

阅读量592

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习算法文章标签：机器学习 knn k近邻

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013412535/article/details/50564172

机器学习算法专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了K近邻算法的基本原理及其三个核心要素：k值的选择、距离度量及分类决策规则。通过实例讲解了如何利用K近邻法进行分类预测，并探讨了不同参数设置对算法性能的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

k近邻法（k-Nearest eighbor，K-NN）是一种基本分类和回归方法。K近邻法的输入为实例的特征向量，对应的特征空间的点：输出为实例的类别，可以取多类。

k值的选择，距离度量，和分类决策规则是k近邻法的三个基本要素。

K近邻算法

给定一个训练数据集，对新的输入实例，在训练数据集中找到跟它最近的k个实例，根据这k个实例的类判断它自己的类（一般采用多数表决的方法）。

k近邻模型

模型

当3要素确定的时候，对任何实例（训练或输入），它所属的类都是确定的，相当于将特征空间分为一些子空间。

距离度量

对n维实数向量空间Rn，经常用Lp距离或曼哈顿Minkowski距离。

Lp距离定义如下：

当p=2时，称为欧氏距离：

当p=1时，称为曼哈顿距离：

当p=∞，它是各个坐标距离的最大值，即：

用图表示如下：

k值的选择

k较小，整体模型变得复杂，容易被噪声影响，发生过拟合。

k较大，较远的训练实例也会对预测起作用，容易发生错误。

在应用中，k一般取一个比较小的数值，通常采用交叉验证法来选取最优的k值。

分类决策规则

使用0-1损失函数衡量，那么误分类率是：

Nk是近邻集合，要使左边最小，右边的必须最大，所以多数表决=经验最小化。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。