15-删除低方差特征与相关系数

最新推荐文章于 2023-05-15 21:10:21 发布

yuhui_2000

最新推荐文章于 2023-05-15 21:10:21 发布

阅读量1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：黑马程序员3天快速入门Python机器学习文章标签： python 机器学习数据分析

本文链接：https://blog.csdn.net/yuhui_2000/article/details/114545611

本文介绍了特征选择的重要性，特别是过滤式方法中的低方差特征过滤和皮尔森相关系数。讲解了如何在sklearn库中实现低方差特征的选择，并通过代码演示了具体步骤。此外，还探讨了皮尔森相关系数的计算公式、特点以及如何在Python中计算数据的相关性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

什么是特征选择？

定义

在这里插入图片描述

举例说明特征选择的定义

在这里插入图片描述

特征选择的方法

在这里插入图片描述

相关系数——特征与特征之间的相关程度

在sklearn中如何实现特征选择

在这里插入图片描述

过滤式

低方差特征过滤

什么是低方差特征过滤

在这里插入图片描述

如何在sklearn中实现低方差特征过滤

在这里插入图片描述

代码演示

原始数据：

在这里插入图片描述

代码：

# -*- coding: utf-8 -*-

"""
@Time    : 2021/3/8 19:48
@Author  : yuhui
@Email   : [email protected]
@FileName: 15_删除低方差特征与相关系数.py
@Software: PyCharm
"""

import pandas as pd
from sklearn.feature_selection import VarianceThreshold

def low_variance_feature_filtering():
	"""低方差特征过滤"""
	# 获取数据
	data=pd.read_csv("../data/factor_returns.csv")
	data=data.iloc[:,1:-2]
	# print(data)
	# 实例化一个转换器类
	transfer=VarianceThreshold(threshold=10)

	# 调用方法
	data_new=transfer.fit_transform(data)

	# 查看结果
	print(data_new.shape)

if __name__ == '__main__':
    # low_variance_feature_filtering()

运行结果：

D:\Anaconda3\Installation\envs\math\python.exe D:/Machine_Learning/Machine_Learning_1/code/15_删除低方差特征与相关系数.py
(2318, 7)

Process finished with exit code 0

补充：

我的文件结构

在这里插入图片描述

原始文件中的内容

index,pe_ratio,pb_ratio,market_cap,return_on_asset_net_profit,du_return_on_equity,ev,earnings_per_share,revenue,total_expense,date,return
0,000001.XSHE,5.9572,1.1818,85252550922.0,0.8008,14.9403,1211444855670.0,2.01,20701401000.0,10882540000.0,2012-01-31,0.027657228229937388
1,000002.XSHE,7.0289,1.588,84113358168.0,1.6463,7.8656,300252061695.0,0.326,29308369223.2,23783476901.2,2012-01-31,0.08235182370820669
2,000008.XSHE,-262.7461,7.0003,517045520.0,-0.5678,-0.5943,770517752.56,-0.006,11679829.03,12030080.04,2012-01-31,0.09978900335112327
3,000060.XSHE,16.476,3.7146,19680455995.0,5.6036,14.617,28009159184.6,0.35,9189386877.65,7935542726.05,2012-01-31,0.12159482758620697
4,000069.XSHE,12.5878,2.5616,41727214853.0,2.8729,10.9097,81247380359.0,0.271,8951453490.28,7091397989.13,2012-01-31,-0.0026808154146886697
5,000100.XSHE,10.796,1.5219999999999998,17206724233.0,2.245,7.7394,66034033386.1,0.0974,43883757748.0,43092263405.0,2012-01-31,0.13795588072275808
6,000402.XSHE,8.1032,1.0078,