python核心编程之Python聚类算法之凝聚层次聚类实例分析

最新推荐文章于 2025-07-08 20:42:33 发布

原创

最新推荐文章于 2025-07-08 20:42:33 发布 · 5.0k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#python #编程语言

本文深入探讨了Python中的凝聚层次聚类算法，包括算法原理及其实现技巧。通过MIN方法，文章解释了如何合并最近的点对以构建簇，并对比了单链、全链和组平均三种定义。还展示了运行效果截图，为Python学习者提供了实用参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章主要介绍了Python聚类算法之凝聚层次聚类的原理与具体使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
本文实例讲述了Python聚类算法之凝聚层次聚类。分享给大家供大家参考，具体如下：

凝聚层次聚类：所谓凝聚的，指的是该算法初始时，将每个点作为一个簇，每一步合并两个最接近的簇。另外即使到最后，对于噪音点或是离群点也往往还是各占一簇的，除非过度合并。对于这里的“最接近”，有下面三种定义。我在实现是使用了MIN，该方法在合并时，只要依次取当前最近的点对，如果这个点对当前不在一个簇中，将所在的两个簇合并就行：

单链(MIN):定义簇的邻近度为不同两个簇的两个最近的点之间的距离。
全链(MAX):定义簇的邻近度为不同两个簇的两个最远的点之间的距离。
组平均：定义簇的邻近度为取自两个不同簇的所有点对邻近度的平均值。

 scoding=utf-8
# Agglomerative Hierarchical Clustering(AHC)
import pylab as pl
from operator import itemgetter
from collections import OrderedDict,Counter
points = [[int(eachpoint.split('#')[0]), int(eachpoint.split('#')[1])] for eachpoint in open("points","r")]
# 初始时每个点指派为单独一簇
groups = [idx for idx in range(len(points))]
# 计算每个点对之间的距离
disP2P = {}
for idx1,point1 in enumerate(points):
  for idx2,point2 in enumerate(points):
    if (idx1 < idx2):
      distance = pow(abs(point1[0]-point2[0]),2) + pow(abs(point1[1]-point2[1]),2)
      disP2P[str(idx1)+"#