目录
Pandas
一个分析结构化数据的工具集。Pandas 以 NumPy 为基础(实现数据存储和运算),提供了专门用于数据分析的类型、方法和函数,对数据分析和数据挖掘提供了很好的支持;同时 pandas 还可以跟数据可视化工具 matplotlib 很好的整合在一起,实现数据可视化。Pandas 核心的数据类型是Series(数据系列)、DataFrame(数据窗/数据框),分别用于处理一维和二维的数据.
Series
Pandas 库中的Series对象可以用来表示一维数据结构,但是多了索引和一些额外的功能。Series类型的内部结构包含了两个数组,其中一个用来保存数据,另一个用来保存数据的索引。
import pandas as pd
import numpy as np
#Pandas 核心的数据类型Series(数据系列,Series对象可以用来表示一维数据结构
#data参数表示数据,index参数表示数据的索引
ser1 = pd.Series(data=[1, 2, 3, 4], index=['东', '南', '西', '北'])
print(ser1) #两列 索引和值
ser1 += 10 #标量运算,数据运算
print(ser1)
#字典的键就是数据的标签(索引),键对应的