python DataFrame的stack()方法，unstack()方法，pivot()方法

原创已于 2022-03-14 15:22:07 修改 · 4.9k 阅读

69 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据挖掘 #数据分析

于 2022-03-12 15:25:29 首次发布

Python数据分析与数据可视化专栏收录该内容

34 篇文章

订阅专栏

本文详细介绍了如何使用pandas库中的stack()方法将列转换为行，unstack()方法反转这一过程，以及pivot()函数用于重塑数据以创建多维度表格。通过实例演示，展示了这些函数在数据重构和分析中的实际应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.stack()

在这里插入图片描述
stack()用于将列索引转换为最内层的行索引，这样叙述比较抽象，看示例就容易理解啦：

准备一组数据，给其设置双索引。

import pandas as pd
data = [['A类', 'a1', 123, 224, 254], ['A类', 'a2', 234, 135, 444], ['A类', 'a3', 345, 241, 324],
        ['B类', 'b1', 112, 412, 466], ['B类', 'b2', 224, 235, 345], ['B类', 'b3', 369, 214, 352],
        ['C类', 'c1', 236, 251, 485], ['C类', 'c2', 378, 216, 515], ['C类', 'c3', 135, 421, 312],
        ['D类', 'd1', 306, 325, 496], ['D类', 'd2', 147, 235, 524], ['D类', 'd3', 520, 222, 267]]
df = pd.DataFrame(data=data, columns=['类别', '编号', 'A指标', 'B指标', 'C指标'])
df = df.set_index(['类别', '编号'])
print(df)

在这里插入图片描述

df = df.stack()
print(df)

在这里插入图片描述
如图，成功将索引列之外的 A指标，B指标，C指标三列放在了同一列。
此时的df，不再是一个DataFrame，而变为了一个Series对象。：

print(type(df))

在这里插入图片描述
该Series的index列不同于原DataFrame的index列，而是在原DataFrame的index列的基础上，又增加了从右边合并过来的部分：

print(df.index)

在这里插入图片描述
此时Values为：

print(df.values)

在这里插入图片描述

2. unstack()

在这里插入图片描述
unstack是stack的逆向操作。
在上述示例的代码的基础上，对上边的df继续调用unstack()方法：

df1 = df.unstack()
print(df1)

在这里插入图片描述
可以看到unstack变回了原来的样子。

3. pivot()

在这里插入图片描述

这里对于上边例子中的数据稍作调整：
不设置多重索引

import pandas as pd
data = [['A类', '1', 123, 224, 254], ['A类', '2', 234, 135, 444], ['A类', '3', 345, 241, 324],
        ['B类', '1', 112, 412, 466], ['B类', '2', 224, 235, 345], ['B类', '3', 369, 214, 352],
        ['C类', '1', 236, 251, 485], ['C类', '2', 378, 216, 515], ['C类', '3', 135, 421, 312],
        ['D类', '1', 306, 325, 496], ['D类', '2', 147, 235, 524], ['D类', '3', 520, 222, 267]]
df = pd.DataFrame(data=data, columns=['类别', '编号', 'A指标', 'B指标', 'C指标'])
print(df)

在这里插入图片描述

df2 = df.pivot(index='编号', columns='类别', values='A指标')
print(df2)

在这里插入图片描述
index和columns分别指设定那一列的值为index，设置那一列的值为columns。values指表格要体现的指标。

df3 = df.pivot(index='类别', columns='编号', values='A指标')
print(df3)

在这里插入图片描述