模糊数学课上完之后对使用python中的sklearn计算矩阵各个元素的相似度有了一些感悟。
首先需要强调的是python中对于矩阵的计算尽量不要在DataFrame中,效率非常低。应该使用numpy。
1 预处理
- 常用1:MinMaxScaler
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics.pairwise import pairwise_distances
from sklearn.metrics.pairwise import cosine_similarity
>>> matrix= np.array([[ 1., -1., 2.],
...