机器学习——聚类算法-层次聚类算法

最新推荐文章于 2025-05-19 08:53:31 发布

Persist_Zhang

最新推荐文章于 2025-05-19 08:53:31 发布

阅读量937

点赞数 15

CC 4.0 BY-SA版权

分类专栏：机器学习 Python 数据分析文章标签：机器学习算法聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39753819/article/details/137056358

机器学习——聚类算法-层次聚类算法

在机器学习中，聚类是一种将数据集划分为具有相似特征的组或簇的无监督学习方法。聚类算法有许多种，其中一种常用的算法是层次聚类算法。本文将介绍聚类问题、层次聚类算法的原理、算法流程以及用Python实现层次聚类算法的示例。

聚类问题

聚类问题是指给定一个数据集，将其中的样本划分为若干组，使得同一组内的样本相似度高，而不同组之间的样本相似度低。聚类算法通常用于探索数据的内在结构，发现数据中的模式或隐藏的信息，以及进行数据的降维和预处理。

层次聚类算法

层次聚类是一种自下而上或自上而下的聚类方法，它不需要事先指定聚类的个数。层次聚类算法主要有两种形式：凝聚式（agglomerative）和分裂式（divisive）。在凝聚式层次聚类中，每个样本开始时被认为是一个独立的簇，然后逐渐合并为越来越大的簇，直到满足某个停止条件为止。而在分裂式层次聚类中，则是从一个包含所有样本的簇开始，逐渐分裂成越来越小的簇，直到每个簇都只包含一个样本为止。

层次聚类算法的原理

层次聚类算法的基本原理是通过计算样本之间的相似度（距离）来构建一个聚类树（树状图），从而得到样本之间的聚类关系。具体来说，层次聚类算法的步骤如下：

计算样本之间的距离： 首先，计算任意两个样本之间的距离或相似度。常用的距离度量包括欧氏距离、曼哈顿距离、余弦相似度等。
初始化聚类： 将每个样本初始化为一个簇。
合并最近的簇： 从距离矩阵中找到距离最近的两个簇，并将它们合并成一个新的簇。
更新距离矩阵： 更新距离矩阵，以反映新簇与其他簇之间的距离。
重复步骤3和步骤4，直到满足停止条件为止：

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄8年

144
原创

3679
点赞

4210
收藏

2473
粉丝

关注

私信

热门文章

分类专栏

Python 131篇
传感数据 61篇
数据分析 101篇
机器学习 44篇
视觉 5篇

上一篇：: 机器学习——LightGBM算法

下一篇：: 机器学习——聚类算法-KMeans聚类

最新评论

深度学习基础——计算量、参数量和推理时间
Persist_Zhang: 通常不包括预处理； start_time = time.time() # 获取开始时间 output = model(input_data) # 模型推理 end_time = time.time() # 获取结束时间 inference_time = end_time - start_time # 计算推理时间如果你的模型包括了前向传播+后处理，那推理时间就包括前向传播+后处理；如果你的模型只有前向传播，后处理不在该推理过程中吗，则FPS只有前向传播时间
传感数据分析——傅里叶滤波与小波滤波
Persist_Zhang: threshold_multiplier 参数用于调整阈值的大小，如果高频噪声较多，就设置大一点。取决因素比较多：噪声强度、信号特征保留需求、小波基函数等等
深度学习基础——计算量、参数量和推理时间
睡觉早点: 意思是不止前向传播，要包括数据预处理和后处理等过程吗
深度学习基础——计算量、参数量和推理时间
Persist_Zhang: 文中表述存在问题，实际工程中需要包含完整的推理过程耗时
自动控制——状态观测器
Persist_Zhang: 可以这么理解，有状态观测器就相当于有传感器测量当前的状态量；而已知的ABC只是模型预设的（理想情况下建模的，没考虑实际的误差）；无状态观测器：若 x ˙ = A x + B u，若存在误差将导致持续偏差，就相当于没有反馈；有状态观测器：等于有反馈了，闭环校正项 L ( y − C x ^ )使估计误差 e = x − x ^ 按 e ˙ = ( A − L C ) e指数收敛至零

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。