python数据分析与机器学习实战
课堂学习笔记
不变不中
多想、多做、多总结,别怕吃亏。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
011.线性回归算法推导
预备知识 高斯分布 一维正态分布 似然函数 最大似然估计 PS: 之前一直比较纠结,最大似然估计的定义为什么是概率密度函数(或概率质量函数)的累积,看了上面的似然函数中的计算实例才逐渐明白。似然函数取得最大值表示相应的参数能够使得统计模型最为合理。 线性模型 线性回归是依据样本数据上抽取的特征,预测连续值结果。简单的例子如依据身高去预测体重,如实验室中根...原创 2018-09-27 18:45:00 · 452 阅读 · 0 评论 -
010.python科学计算库seaborn(下)
category import matplotlib.pyplot as plt import seaborn as sns tips = sns.load_dataset("tips") tips.head() print(tips) # stripplot:画一个散点图,其中一个变量是类别的 sns.stripplot(x="day", y="total_bill", data=原创 2018-09-27 10:35:20 · 536 阅读 · 0 评论 -
009.python科学计算库seaborn(中)
a原创 2018-09-26 17:54:33 · 353 阅读 · 0 评论 -
008.python科学计算库seaborn(上)
测试数据 iris.data Style import seaborn as sns import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt def sinplot(flip=1): x = np.linspace(0, 14, 100) for i in range(1, 7...原创 2018-09-26 16:01:27 · 665 阅读 · 0 评论 -
007.python科学计算库matplotlib(下)
测试数据 fandango_scores.csv bar import matplotlib.pyplot as plt import pandas as pd from numpy import arange reviews = pd.read_csv('fandango_scores.csv') cols = ['FILM', 'RT_user_norm', 'Metacriti...原创 2018-09-16 16:39:00 · 478 阅读 · 0 评论 -
006.python科学计算库matplotlib(上)
测试数据 unrate.csv原创 2018-09-16 15:09:06 · 252 阅读 · 0 评论 -
005.python科学计算库pandas(下)
测试数据 fandango_score_comparison.csv series import pandas as pd from pandas import Series fandango = pd.read_csv('fandango_score_comparison.csv') series_film = fandango['FILM'] print(series_film[...原创 2018-09-15 15:46:35 · 543 阅读 · 0 评论 -
004.python科学计算库pandas(中)
测试数据 titanic_train.csv isnull import pandas titanic_survival = pandas.read_csv("titanic_train.csv") # Pandas库使用NaN(非数字)表示缺失值 # 我们可以使用pandas.isnull()函数,它获取一个pandas series并返回一系列的True和False age = ...原创 2018-09-14 17:34:04 · 314 阅读 · 0 评论 -
003.python科学计算库pandas(上)
测试数据 food_info.csv head import pandas food_info = pandas.read_csv("food_info.csv") # csv文件类型 DataFrame print(type(food_info)) print("---1") # dtypes 返回每个列的数据类型。结果为字典 # food_info.dtyp原创 2018-09-14 14:06:01 · 488 阅读 · 0 评论 -
002.python科学计算库numpy(下)
reshape import numpy as np # arange 在给定的间隔内返回等距值 # reshape 返回一个包含具有新形状的相同数据的数组 a = np.arange(15).reshape(3, 5) print(a) arange import numpy as np # arange 在给定的间隔内返回等距值 print(np.arange(10,...原创 2018-09-13 19:31:46 · 289 阅读 · 0 评论 -
001.python科学计算库numpy(上)
genfromtxt 从文本文件加载数据,并按指定的方式处理缺失值。 import numpy # genfromtxt 从文本文件加载数据,并按指定的方式处理缺失值。 # delimiter 用来分隔值的字符串。 # 默认情况下,任何连续的空格都充当分隔符。 # 一个整数或整数序列也可以作为每个字段的宽度提供 # dtype 结果数组的可选数据类...原创 2018-09-13 16:09:38 · 264 阅读 · 0 评论