2020-004 pandas与numpy中神奇的axis

最新推荐文章于 2025-01-24 14:06:07 发布

SSSimonYang

最新推荐文章于 2025-01-24 14:06:07 发布

阅读量380

点赞数

CC 4.0 BY-SA版权

文章标签： python pandas

本文探讨了在pandas和numpy中axis的概念及其应用。通过实例解析了axis如何影响数据操作，包括排序、合并、归一化等，并介绍了numpy中多维数组的轴处理。同时提出了有趣的思考问题，邀请读者探索两次不同操作结果的原因。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在百奥智汇兼职，基本上比较重的工作就在数据处理，所以pandas和numpy用的比较多。

不知不觉中，pandas各种函数越用越熟练，但是总要靠结果来推算到底应该指定axis=0还是1，你有没有这种经历呢？

经过摸索，我找到了一种axis利于记忆也好解释的理论。下面一起来看看吧！

axis是你要操作的轴。

导入包，创建一个3X4的dataframe。

import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randn(4,3))

data.sum(axis=1)

out:

0   -0.429278
1    0.415985
2    1.555418
3    3.364704
dtype: float64

axis=1，说明我们要对第二个轴进行操作。

操作中处理的是第二个轴一共3个值，3个值被消灭了，被1个和值取代，结果是长度为4的series。

data.drop(1,axis=1)

out:

同样对第二个轴进行操作。

处理的是第二个轴3个值，3个值被drop掉1列后变为2个值，结果是4X2的dataframe。

data_ = pd.DataFrame(np.random.randn(4,3))
pd.concat([data,data_],axis=1)

out:

处理的是第二个轴，data二轴3个值，拼接的data_二轴也为3个值，所以结果是4X6的dataframe。

data.sort_values([0],axis=1)

out:

处理的是第二个轴3个值，对第一个轴name为0对应的3个值进行排序，从小到大，结果是4X3的dataframe。

下面为常见的归一化：

data.apply(lambda a:(a-np.min(a))/(np.max(a)-np.min(a)),axis=1)

out:

处理的是第二个轴3个值，对第一轴每一个name对应的三个值进行归一化处理，结果是4X3的dataframe 。

强行输出就会看的更清晰：

data.apply(lambda a:print(a),axis=1)

0   -0.002617
1   -0.772246
2    0.345585
Name: 0, dtype: float64
0

200万优质内容无限畅学