pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

原创已于 2022-07-09 16:55:07 修改 · 10w+ 阅读

70 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #开发语言

于 2022-05-11 18:58:44 首次发布

Pandas数据分析专栏收录该内容

53 篇文章

订阅专栏

本文详细介绍了如何使用Pandas库处理缺失值，包括删除全部为NaN的行和列、删除含有NaN的行和列、定位并删除特定列的NaN值，以及筛选和替换NaN数据的方法。通过实例展示了每种操作的代码实现和输出结果，是数据预处理的重要参考。

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

在处理缺失值的时候，总会遇到各种问题

5.删除指定某一列有nan，这样即可定位到所在行的index，然后对该index进行drop操作即可df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行df.drop(df[np.isnan(df[‘open’])].index, inplace=True)

6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行

7.筛选出nan的数据

8.筛选出非nan的数据

9.替换nan值

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)

先看看如下数据

1.删除全部为nan的行

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中全部为NaN的行
data = data.dropna(axis=0, how='all')
print(data)

输出：

2.删除含有nan的行

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中含有NaN的行
data = data.dropna(axis=0, how='any')
print(data)

输出：

3.删除全部为nan的列

# 删除全部为nan的列
data = data.dropna(axis=1, how='all')

数据如下：

输出：

4. 删除包含nan的列

# 删除包含nan的列
data = data.dropna(axis=1, how='any')

数据如下

输出：

5.删除指定某一列有nan，这样即可定位到所在行的index，然后对该index进行drop操作即可
df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行
df.drop(df[np.isnan(df[‘open’])].index, inplace=True)

数据如下:

输出:

6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行

7.筛选出nan的数据

df_nan = df[df['往来单位编号'].isna()]

8.筛选出非nan的数据

df_notnan = df[~df['往来单位编号'].isna()]

9.替换nan值

df.fillna('', inplace=True) # 将nan替换为'',否则无法保存到MySQL

10.有时候是空字符串的情况

nan_df = df[(df['xxx'].str.len() <= 5) | (df['xxx'].isna())]

您可能感兴趣的与本文相关的镜像

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

pandas删除nan数据，筛选出nan的数据，筛选出非nan的数据，替换nan值

1.删除全部为nan的行

2.删除含有nan的行

3.删除全部为nan的列

4. 删除包含nan的列

5.删除指定某一列有nan，这样即可定位到所在行的index，然后对该index进行drop操作即可 df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行 df.drop(df[np.isnan(df[‘open’])].index, inplace=True)

6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行

7.筛选出nan的数据 df_nan = df[df['往来单位编号'].isna()] 8.筛选出非nan的数据 df_notnan = df[~df['往来单位编号'].isna()]

9.替换nan值

df.fillna('', inplace=True) # 将nan替换为'',否则无法保存到MySQL

5.删除指定某一列有nan，这样即可定位到所在行的index，然后对该index进行drop操作即可
df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行
df.drop(df[np.isnan(df[‘open’])].index, inplace=True)

7.筛选出nan的数据

df_nan = df[df['往来单位编号'].isna()]

8.筛选出非nan的数据

df_notnan = df[~df['往来单位编号'].isna()]