- 博客(7)
- 收藏
- 关注
原创 Sklearn学习笔记
开发环境: Anacoda-jupyter 下载graphviz 一、sklearn的基本信息 官网:https://scikit-learn.org/stable/ 推荐书籍:《数据挖掘导论》《机器学习》又称西瓜书 sklearn分为六个板块,如下: 分类 回归 聚类 降维 模型选择 数据的预处理 二、决策树 学习重点: 解决两个重要问题: 如何从数据表中找出最佳节点和最佳分支?
2022-01-09 14:52:33
899
原创 数据分析挖掘与建模(操作篇)
数据分析的大致步骤:数据收集——数据处理——数据分析——数据可视化 做数据分析之前需要思考的问题: 查看数据的shape、Columns 分析想要数据之间的什么关系 一、加载数据 读取文件:read_ 并将多个excel表格合并:concat();注意按照行拼接 二、数据预处理:NA空缺值 先查看所有的数值:info() 删除掉空缺的值:dropna();注意是删除列,axis=1 修改源数据:inpalce=True;意思是改变原来的值 三、分析数据 ..
2021-12-25 17:16:53
1890
原创 Matplotlib和seaborn(四)
饼图/条形图/直方图/散点图 1、如何解决乱码问题? plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False 2、如何保存图片?可以保存为png、pdf等格式 plt.savefig('C:\data\第四章\可视化.png') 3、确保图形能够展现出来 %matplotlib inline 绘图基础语法(plot): title:是图表的标题名称 ticks...
2021-12-25 14:10:37
878
原创 kaggle Zillow Prize 项目实战
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 一、读于csv数据,并查看数据 train_df=pd.read_csv("./input/train_2016_v2.csv", parse_dates=["transactiondate"]) train_df.shape parse_dates:将交易日时间字符串转换成日期格式 二、 绘制散点图 pl..
2021-12-25 14:05:07
832
原创 Panda库知识点(三)
Pandas的基本介绍:左边是索引(index),右边是values(数据);pandas有两个最主要的数据结构:series和dataframe series可以保存任何数据类型:int、str、float... 一、Series的创建 1.1通过列表创建 1.2 通过将numpy数组放在series中创建 1.3通过字典创建 二、Series的基本用法 isnull是判断是否为空,空就是True head()默认前5行,()里是数字几,就是几行 tail()默认后5行,()里是数字...
2021-12-01 15:39:11
737
原创 Numpy库知识点(二)
首先要导入numpy库 import numpy as np 一、数组的创建 方法一:使用array来创建数组 a=np.array([1,2,3,4]) print(a) [1 2 3 4] 方法二:使用np.arange来创建数组 a=np.arange(0,10,2) a array([0, 2, 4, 6, 8]) 方法三:使用np.random来创建N行N列的数组(0~1的随机数) a=np.random.random((2,2)) a array([[0.1352.
2021-12-01 14:58:45
1627
原创 Python基础知识(一)
一、变量和字符串: 1.1 变量的命名 由字母、数字、下划线等字符及其组合构成 首字符不能是数字 ,且中间不能出现空格 1.2 字符串 什么是字符串 单引' ',或者双引" " 如何修改字符串大小写? .title()首字母大写 .upper()全都大写 .lower()全都小写 如何删除空白? .lstrip()清除字符串开头的空白 .rstrip()清除字符串结尾的空白 .strip()清除字符串所
2021-12-01 09:58:16
992
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人