4.5 创建透视表与交叉表

清木!

已于 2023-04-20 21:00:37 修改

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： Python数据分析与应用文章标签： python pandas 数据分析

于 2023-04-20 12:03:17 首次发布

本文链接：https://blog.csdn.net/QMU111/article/details/130261148

本文介绍了如何使用pandas的pivot_table和crosstab函数创建透视表和交叉表，用于数据分析。通过示例展示了如何设置不同参数，如index、columns、values、aggfunc等，以实现数据的聚合、分组和填充缺失值。同时，还展示了如何通过这些函数分析不同菜品的销量和金额之间的关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据透视表（Pivot Table）是数据分析中一种常用的工具之一，根据一个或多个键值对数据进行聚合，根据行或列的分组键将数据划分到各个区域。在pandas中，除了可以使用groupby对数据分组聚合实现透视功能外，还提供了更为简单的方法。这里以菜单订单数据为例制作透视表与交叉表，分析不同菜品的销量和金额之间的关系。
（1）使用pivot_table函数制作菜品日销量透视表。
（2）使用crosstab函数制作菜品销量交叉表。

4.5.1利用pivot_table函数可以实现透视表

pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc=‘mean’, fill_value=None, margins=False, dropna=True, margins_name=‘All’)

pivot_table函数的常用参数及其说明

在这里插入图片描述

import pandas as pd
import numpy as np
detail = pd.read_csv('E:/Input/ptest.csv', encoding='ANSI')
## 1、使用订单号作为透视表索引制作透视表
# 以id作为分组键创建的订单透视表
detailPivot = pd.pivot_table(detail[['id', 'counts', 'amounts']], index='id')
print(detailPivot)

在这里插入图片描述

由上面结果可以看出，在不特殊指定聚合函数aggfunc时，会默认使用numpy.mean进行聚合运算，numpy.mean会自动过滤掉非数值类型数据。可以通过指定aggfunc参数修改聚合函数。

## 2、修改聚合函数后的透视表
# 以id作为分组键创建的订单销量与售价总和透视表
detailPivot2 =pd.pivot_table(detail[['id', 'counts', 'amounts']], index='id', aggfunc=np.sum)
print(detailPivot2)

在这里插入图片描述

和groupby方法分组的时候相同，pivot_table函数在创建透视表的时候分组键index可以有多个。

## 3、使用id和name作为索引的透视表
detailPivot3 = pd.pivot_table(detail[['id', 'name', 'counts', 'amounts']],
                              index=['id', 'name'], aggfunc=np.sum)
print(detailPivot3)

通过设置columns参数可以指定列分组。

## 4、指定name为列分组键的透视表
detailPivot4 = pd.pivot_table(detail[['id', 'name', 'counts', 'amounts']],
                              index='id', columns='name', aggfunc=np.sum)
print(detailPivot4)

当全部数据列数很多时，若只想要显示某列，可以通过指定values参数来实现。

## 5、指定某些列制作透视表
detailPivot5 = pd.pivot_table(detail[['id', 'name', 'counts', 'amounts']]

最低0.47元/天解锁文章

200万优质内容无限畅学