python计算相似矩阵

最新推荐文章于 2025-07-08 19:59:30 发布

原创

最新推荐文章于 2025-07-08 19:59:30 发布 · 1.5w 阅读

24 ·

CC 4.0 BY-SA版权

这篇博客讲述了在模糊数学课程后，作者对使用Python的sklearn库计算矩阵相似度的体会。强调了在处理矩阵时应避免使用DataFrame，推荐使用numpy。预处理阶段提到了MinMaxScaler和StandardScaler，而计算相似度矩阵时，介绍了sklearn.metrics.pairwise.cosine_similarity和pairwise_distances两种方法，后者是前者减1取绝对值得到的。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

模糊数学课上完之后对使用python中的sklearn计算矩阵各个元素的相似度有了一些感悟。

首先需要强调的是python中对于矩阵的计算尽量不要在DataFrame中，效率非常低。应该使用numpy。

1 预处理

常用1:MinMaxScaler

from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics.pairwise import pairwise_distances
from sklearn.metrics.pairwise import cosine_similarity

>>> matrix= np.array([[ 1., -1.,  2.],
...