K-means和k-means++

原创已于 2023-05-15 16:43:13 修改 · 484 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#大数据 #k-means #机器学习 #算法

于 2022-07-16 09:27:14 首次发布

数学建模专栏收录该内容

2 篇文章

订阅专栏

本文详细介绍了K-means聚类算法的工作原理，包括如何通过计算欧氏距离、曼哈顿距离和余弦相似度来衡量样本相似性。此外，深入探讨了k-means++的改进策略，以及如何解决初始质心选择的随机性问题。通过实例和流程图，帮助读者理解算法优化过程，并提供了相关技术博客的引用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

聚类

假设一个样本集C={x1,x2,...,xl}，聚类算法把这个样本集划分成m个不相交的子集C1,...,Cm即簇。这些子集的并集是整个样本集：

且每个样本只能属于这些子集中的一个，即任意两个子集之间没有交集：

同一子集内的样本要具备相似性，相似性没有固定的定义，根据不同场景由人工设定。

相似度

计算向量之间的相似度的常用方法：

欧式距离：空间中两点的直线距离。

2. 曼哈顿距离：又称“城市街区距离”

3. 余弦距离

余弦相似度用向量空间中的两个向量夹角的余弦值作为衡量两个样本差异的大小。
余弦值越接近 1 ，说明两个向量夹角越接近 0 度，表明两个向量越相似。

注意：对于特征向量中含有不同量级的数据应将数据归一化

K-means聚类算法及其优化

k-means

原理：对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇。让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。

假设簇划分为C1,…,Ck，则优化目标是最小化平方误差E（使n组集群间的方差相等，数学描述为最小化惯性或集群内的平方和。）:

k-means++

k-means的初始质心选择的随机性是影响算法迭代效率的原因，针对这个问题，提出了改进方案k-maens++

means++按照如下的思想选取K个聚类中心:

假设已经选取了n个初始聚类中心(0<n<K)，则在选取第n+1个聚类中心时；

距离当前n个聚类中心越远的点会有更高的概率被选为第n+1个聚类中心

在选取第一个聚类中心(n=1)时同样通过随机的方法。

聚类中心当然是互相离得越远越

过程：

参考资料

K-means，K-means++方法详解-机器学习分类问题常见算法_易烊千蝈的博客-CSDN博客_kmeans++

聚类算法之K-Means算法原理及实现_Doris_mR的博客-CSDN博客_kmeans算法原理及其流程图

机器学习(2): K-means (k均值) 聚类算法小结_TechArtisan6的博客-CSDN博客_k均值聚类算法

博客等级

码龄3年

21
原创

64
点赞

184
收藏

5624
粉丝

关注

私信

热门文章

分类专栏

#Springboot+Vue 4篇
s-shop 2篇
#Web 8篇
Java_study 5篇
#问题 5篇
数学建模 2篇

展开全部收起

上一篇：: 学习笔记_Java_2

下一篇：: 数学建模回归拟合

最新评论

Maven出现 Could not find artifact 的解决方法
youjizz_: 就是这个阿里云maven里面找不到
在构建好SpringBoot项目之后运行爆出java: 无效的源发行版: 19
CSDN-Ada助手: 恭喜您写了第20篇博客！标题看起来对于解决运行SpringBoot项目时的问题非常有帮助。很抱歉听到您在构建项目后遇到了这样的错误。或许您可以在博客中详细介绍一下这个问题的原因以及解决方法，对于其他开发者来说会非常有帮助。期待您下一步的创作，希望您能继续分享有关SpringBoot的经验和教程，让更多人受益。谢谢您的分享！
Redis 点击 redis-server.exe 出现闪退的解决方法
CSDN-Ada助手: 恭喜您写了第15篇博客！标题看上去很吸引人，我很期待阅读这篇关于解决Redis闪退问题的文章。持续创作是一项很不容易的事情，但您已经做得非常出色了。在下一步的创作中，我建议您可以尝试探索一些关于Redis的高级用法或者如何优化Redis性能的主题，这将为读者提供更多有价值的知识。谢谢您的分享！
Maven出现 Could not find artifact 的解决方法
莉莉可: 这个配置后出现了Process terminated错误怎么办
s-shop商品详情页（移动端）使用Vue实现主要用到了Vant-ui
CSDN-Ada助手: 恭喜您写完了第18篇博客！标题看起来非常有趣，我很期待阅读您关于s-shop商品详情页的Vue实现的经验分享。使用Vant-ui作为工具，无疑能够提升用户体验和界面美观度。希望您在博文中能够详细介绍您是如何运用Vant-ui来实现移动端商品详情页的，这将对我们这些刚刚接触Vue的初学者非常有帮助。同时，也期待您能够分享一些在开发过程中遇到的挑战和解决方案。不过，我知道您一定会以谦虚的态度对待这篇博文，因为您一直以来都在以谦虚的态度分享自己的经验。加油，期待您的下一篇创作！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。