脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - pandas快速处理Excel,替换Nan,转字典的操作

pandas快速处理Excel,替换Nan,转字典的操作

2021-09-29 00:01安心写bug Python

这篇文章主要介绍了pandas快速处理Excel,替换Nan,转字典的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

pandas读取Excel

?
1
2
3
import pandas as pd
# 参数1:文件路径,参数2:sheet名
pf = pd.read_excel(path, sheet_name='sheet1')

删除指定列

?
1
2
# 通过列名删除指定列
pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)

替换列名

?
1
2
3
4
5
6
7
8
9
10
11
12
13
# 旧列名 新列名对照
columns_map = {
    '列名1': 'newname_1',
    '列名2': 'newname_2',
    '列名3': 'newname_3',
    '列名4': 'newname_4',
    '列名5': 'newname_5',
    # 没有列名的情况
    'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]

替换 Nan

通常使用

?
1
pf.fillna('新值')

替换表格中的空值,(Nan)。

但是,你可能会发现 fillna() 会有不好使的时候,记得加上 inplace=True

?
1
2
# 加上 inplace=True 表示修改原对象
pf.fillna('新值', inplace=True)

官方对 inplace 的解释

inplace : boolean, default False

If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).

全列输出不隐藏

你可能会发现,输出表格的时候会出现隐藏中间列的情况,只输出首列和尾列,中间用 … 替代。

加上下面的这句话,再打印的话,就会全列打印。

?
1
2
pd.set_option('display.max_columns', None)
print(pf)

将Excel转换为字典

?
1
pf_dict = pf.to_dict(orient='records')

全部代码

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import pandas as pd
pf = pd.read_excel(path, sheet_name='sheet1')
columns_map = {
    '列名1': 'newname_1',
    '列名2': 'newname_2',
    '列名3': 'newname_3',
    '列名4': 'newname_4',
    '列名5': 'newname_5',
    # 没有列名的情况
    'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]
pf.fillna('Unknown', inplace=True)
# pd.set_option('display.max_columns', None)
# print(smt)
pf_dict = pf.to_dict(orient='records')

补充:python pandas replace 0替换成nan,bfill/ffill

0替换成nan

一般情况下,0 替换成nan会写成

?
1
df.replace(0, None, inplace=True)

然而替换不了,应该是这样的

?
1
df.replace(0, np.nan, inplace=True)

nan替换成前值后值

?
1
2
df.ffill(axis=0) # 用前一个值替换
df.bfill(axis=0) # 用后一个值替换

以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。

原文链接:https://blog.csdn.net/qq_36963372/article/details/85779930

延伸 · 阅读

精彩推荐