活动介绍

Pandas中缺失值及空值处理的多种实现方式

preview
共1个文件
txt:1个
需积分: 0 0 下载量 121 浏览量 更新于2025-07-04 收藏 308B ZIP 举报
资源下载链接为: https://pan.quark.cn/s/1bfadf00ae14 相关函数 df.dropna():用于删除数据中的空值。 df.fillna():用于填充数据中的空值。 df.isnull() 和 df.isna():这两个函数功能相同,都是用来检测数据中的空值。 相关概念 空值:在 pandas 中,空值指的是“”(空字符串)。 缺失值:在 DataFrame 中,缺失值表现为 nan 或者 naT(缺失时间);在 Series 中,缺失值为 none 或者 nan。 函数具体解释 DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False): 函数作用 :主要是用来删除包含空值的行或者列。 参数说明 : axis:代表操作的维度。当 axis=0 时,表示沿着索引(行)的方向进行操作;当 axis=1 时,表示沿着列的方向进行操作,其默认值是 0。 how:用于指定删除的条件。如果 how='all',表示只有当一行或者一列的所有数据都是空值时,才会删除这一行或者一列;如果 how='any'(默认值),表示只要一行或者一列中存在至少一个空值,就会删除这一行或者一列。 thresh:这是一个阈值参数。它用来指定在一行或者一列中非空值的最小数量。如果一行或者一列中非空值的数量小于这个阈值,那么这一行或者一列就会被删除。例如,当 thresh=3 时,只有当一行或者一列中有 3 个或者更多非空值时,这一行或者一列才会被保留,否则就会被删除。 subset:这个参数用于指定只考虑数据帧中某些列或者行的子集。例如,在删除行时,可以通过这个参数指定只考虑某些列中的空值来决定是否删除行;在删除列时,可以通过这个参数指定只考虑某些行中的空值来决定是否删除列。 inpl
身份认证 购VIP最低享 7 折!
30元优惠券