主成分分析法确定权重

最新推荐文章于 2022-05-09 15:12:51 发布

茶冻茶茶

最新推荐文章于 2022-05-09 15:12:51 发布

阅读量9.8k

点赞数 9

CC 4.0 BY-SA版权

分类专栏：数据竞赛

本文链接：https://blog.csdn.net/Zsusan7/article/details/119684143

数据竞赛专栏收录该内容

5 篇文章

订阅专栏

本文介绍了如何利用Python实现主成分分析法来确定权重。首先概述了主成分分析法的基本原理，接着讲解了数据归一化的必要性和方法。然后通过PCA降维分析，确定影响权重的主要因素。最后，讨论了权重的归一化处理，以及如何获取相关代码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在数模中，确定权重方法有很多种，比如主成分分析法、层次分析法、熵权法、相关系数作为权重等。
网上很多教程都是用spss计算权重，这里主要讲利用python通过主成分分析法确定权重。

主成分分析法概述

主成分分析法是一种线性的降维算法，通过将N维特征进行正交变换，得到相互独立的k维(k<N)数据，通过分析得出“主成分”，利用“主成分”确定影响权重。

数据归一化

为了消除不同变量的量纲的影响，在对数据进行主成分分析前，首先要对数据进行标准化，之所以要对数据进行标准化。
涉及m个样本，n个指标，第j个样本的第i个指标值为，将各个归一化值按如下公式进行归一化为：
在这里插入图片描述

from sklearn.preprocessing import MinMaxScaler
mms = MinMaxScaler()
data = mms.fit_transform(data)

pca降维

from sklearn.decomposition import PCA
from sklearn import preprocessing
pca = PCA()
pca.fit(data)

先大致看一下各主成分的累计贡献值，确定k个主成分

pca.components_ #模型的各个特征向量 也叫成分矩阵
pca.explained_variance_  # 贡献方差，即特征根
pca.explained_variance_ratio_ #各个成分各自的方差百分比（贡献率）

pca = PCA(5) #确定5个主成分
pca.fit(data)
low_d = pca.transform(data)# low_d降维后的结果

确定权重

# 求指标在不同主成分线性组合中的系数
k1_spss = pca.components_ / np.sqrt(pca.explained_variance_.reshape(-1, 1))  #成分得分系数矩阵
j = 0
Weights = []
for j in range(len(k1_spss)):
    for i in range(len(pca.explained_variance_)):
        Weights_coefficient = np.sum(100 * (pca.explained_variance_ratio_[i]) * (k1_spss[i][j])) / np.sum(
            pca.explained_variance_ratio_)
    j = j + 1
    Weights.append(np.float(Weights_coefficient))
print('Weights',Weights)

#Weights [11.55267610875436, 22.403803988479392, 13.391066309212121, -2.3723300938403176, -0.5180775289478192]

权重归一化

Weights=pd.DataFrame(Weights)
Weights1 = preprocessing.MinMaxScaler().fit(Weights)
Weights2 = Weights1.transform(Weights)
print('Weights2',Weights2)

'''
Weights2 [[0.56203305]
 [1.        ]
 [0.63623309]
 [0.        ]
 [0.07484027]]
 '''