【机器学习】K-Means聚类算法

最新推荐文章于 2025-07-06 15:29:28 发布

原创

最新推荐文章于 2025-07-06 15:29:28 发布 · 906 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #算法 #kmeans #聚类 #人工智能

本文介绍了K-Means聚类算法，这是一种无监督学习方法，用于将数据自组织成k个簇。文章详细阐述了算法步骤，包括簇内点的紧密连接和簇间距离最大化。通过实例展示了如何使用sklearn库实现K-Means，并讨论了如何选择最佳的簇数k，引入了轮廓系数作为评估指标。最后提到了聚类结果可能不是全局最优，并建议多次尝试以找到最佳分类结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

K-Means是一种聚类算法，与之前提到的朴素贝叶斯等算法不同，它属于无监督学习。无监督学习是什么意思呢？简单来说，之前的算法中我们是利用特征 x 和类别 y 来进行训练、分类的，而无监督学习是指不需要我们提供具体的类别 y ，而让数据自己聚在一起，形成 k 个簇，以实现分类的目的。

具体方法是通过对给定的样本进行划分，分为 k 个簇，使得簇内的点尽量紧密的连在一起，而簇间的距离尽量大，评判的标准就是通过欧氏距离。

主要包括两个步骤（首先初始化 k 个质心）：

分别计算样本点与各个质心的距离，来判断样本归属于哪个簇；
寻找得到的簇的新质心，并更新。

重复循环上述两步，直到平均距离最小，即找到了最佳的质心以及簇的分类。

接下来看看如何通过程序来实现。首先需要用到sklearn中的方法来生成一些用来测试的数据——make_blobs。</

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。