自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Sklearn学习笔记

开发环境: Anacoda-jupyter 下载graphviz 一、sklearn的基本信息 官网:https://scikit-learn.org/stable/ 推荐书籍:《数据挖掘导论》《机器学习》又称西瓜书 sklearn分为六个板块,如下: 分类 回归 聚类 降维 模型选择 数据的预处理 二、决策树 学习重点: 解决两个重要问题: 如何从数据表中找出最佳节点和最佳分支?

2022-01-09 14:52:33 899

原创 数据分析挖掘与建模(操作篇)

数据分析的大致步骤:数据收集——数据处理——数据分析——数据可视化 做数据分析之前需要思考的问题: 查看数据的shape、Columns 分析想要数据之间的什么关系 一、加载数据 读取文件:read_ 并将多个excel表格合并:concat();注意按照行拼接 二、数据预处理:NA空缺值 先查看所有的数值:info() 删除掉空缺的值:dropna();注意是删除列,axis=1 修改源数据:inpalce=True;意思是改变原来的值 三、分析数据 ..

2021-12-25 17:16:53 1890

原创 Matplotlib和seaborn(四)

饼图/条形图/直方图/散点图 1、如何解决乱码问题? plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False 2、如何保存图片?可以保存为png、pdf等格式 plt.savefig('C:\data\第四章\可视化.png') 3、确保图形能够展现出来 %matplotlib inline 绘图基础语法(plot): title:是图表的标题名称 ticks...

2021-12-25 14:10:37 878

原创 kaggle Zillow Prize 项目实战

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 一、读于csv数据,并查看数据 train_df=pd.read_csv("./input/train_2016_v2.csv", parse_dates=["transactiondate"]) train_df.shape parse_dates:将交易日时间字符串转换成日期格式 二、 绘制散点图 pl..

2021-12-25 14:05:07 832

原创 Panda库知识点(三)

Pandas的基本介绍:左边是索引(index),右边是values(数据);pandas有两个最主要的数据结构:series和dataframe series可以保存任何数据类型:int、str、float... 一、Series的创建 1.1通过列表创建 1.2 通过将numpy数组放在series中创建 1.3通过字典创建 二、Series的基本用法 isnull是判断是否为空,空就是True head()默认前5行,()里是数字几,就是几行 tail()默认后5行,()里是数字...

2021-12-01 15:39:11 737

原创 Numpy库知识点(二)

首先要导入numpy库 import numpy as np 一、数组的创建 方法一:使用array来创建数组 a=np.array([1,2,3,4]) print(a) [1 2 3 4] 方法二:使用np.arange来创建数组 a=np.arange(0,10,2) a array([0, 2, 4, 6, 8]) 方法三:使用np.random来创建N行N列的数组(0~1的随机数) a=np.random.random((2,2)) a array([[0.1352.

2021-12-01 14:58:45 1627

原创 Python基础知识(一)

一、变量和字符串: 1.1 变量的命名 由字母、数字、下划线等字符及其组合构成 首字符不能是数字 ,且中间不能出现空格 1.2 字符串 什么是字符串 单引' ',或者双引" " 如何修改字符串大小写? .title()首字母大写 .upper()全都大写 .lower()全都小写 如何删除空白? .lstrip()清除字符串开头的空白 .rstrip()清除字符串结尾的空白 .strip()清除字符串所

2021-12-01 09:58:16 992

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除