Python数据分析NumPy和pandas（三十二、数据拆分-应用-合并）

最新推荐文章于 2025-05-21 11:28:55 发布

FreedomLeo1

最新推荐文章于 2025-05-21 11:28:55 发布

阅读量1.3k

点赞数 25

CC 4.0 BY-SA版权

分类专栏： Python数据分析文章标签： python 数据分析 numpy和pandas 数据拆分-应用-合并缺失值填充、随机采样、加权平均线性回归statsmodels

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FreedomLeo1/article/details/143757013

最常用的 GroupBy 方法是 apply，apply 将正在操作的对象拆分为多个片段，在每个片段上调用传递给它函数，然后尝试连接这些片段。

还是用前面的小费数据集tips.csv，它的内容如下图：

假设我们想按smoker进行分组并选择前五个tip_pct值：

import numpy as np
import pandas as pd

tips = pd.read_csv("examples/tips.csv")
tips["tip_pct"] = tips["tip"] / tips["total_bill"]

# 自定义函数top，根据选择列tip_pct值最大的前n行
def top(df, n=5, column="tip_pct"):
    return df.sort_values(column, ascending=False)[:n]

# 然后按 smoker 进行分组，并使用top函数调用 apply：
result = tips.groupby("smoker").apply(top)
print(result)

输出结果：

		total_bill	tip	smo

了解本专栏

超级会员免费看

博客等级

码龄14年

73
原创

1650
点赞

1218
收藏

1074
粉丝

关注

私信

分类专栏

Python机器学习付费 25篇
Python数据分析付费 48篇

上一篇：: Python数据分析NumPy和pandas（三十一、数据聚合）

下一篇：: Python数据分析NumPy和pandas（三十三、Group变换和解锁GroupBy）

最新评论

Python机器学习笔记（六、核支持向量机）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619481806。
Python数据分析NumPy和pandas（十四、汇总和描述性统计量计算）
征途黯然.: The expertise in Python数据分析NumPy和pandas十四汇总和描述性统计量计算 is admirable, and the article is highly valuable.
Python数据分析NumPy和pandas（一、环境安装）
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Python数据分析NumPy和pandas（一、环境安装）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/619300022。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

FreedomLeo1 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。