pandas快速處理Excel,替換Nan,轉(zhuǎn)字典的操作
pandas讀取Excel
import pandas as pd # 參數(shù)1:文件路徑,參數(shù)2:sheet名 pf = pd.read_excel(path, sheet_name='sheet1')
刪除指定列
# 通過列名刪除指定列 pf.drop(['序號', '替代', '簽名'], axis=1, inplace=True)
替換列名
# 舊列名 新列名對照
columns_map = {
'列名1': 'newname_1',
'列名2': 'newname_2',
'列名3': 'newname_3',
'列名4': 'newname_4',
'列名5': 'newname_5',
# 沒有列名的情況
'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]
替換 Nan
通常使用
pf.fillna('新值')
替換表格中的空值,(Nan)。
但是,你可能會發(fā)現(xiàn) fillna() 會有不好使的時(shí)候,記得加上 inplace=True
# 加上 inplace=True 表示修改原對象
pf.fillna('新值', inplace=True)
官方對 inplace 的解釋
inplace : boolean, default False
If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).
全列輸出不隱藏
你可能會發(fā)現(xiàn),輸出表格的時(shí)候會出現(xiàn)隱藏中間列的情況,只輸出首列和尾列,中間用 … 替代。
加上下面的這句話,再打印的話,就會全列打印。
pd.set_option('display.max_columns', None)
print(pf)
將Excel轉(zhuǎn)換為字典
pf_dict = pf.to_dict(orient='records')
全部代碼
import pandas as pd
pf = pd.read_excel(path, sheet_name='sheet1')
columns_map = {
'列名1': 'newname_1',
'列名2': 'newname_2',
'列名3': 'newname_3',
'列名4': 'newname_4',
'列名5': 'newname_5',
# 沒有列名的情況
'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.drop(['序號', '替代', '簽名'], axis=1, inplace=True)
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]
pf.fillna('Unknown', inplace=True)
# pd.set_option('display.max_columns', None)
# print(smt)
pf_dict = pf.to_dict(orient='records')
補(bǔ)充:python pandas replace 0替換成nan,bfill/ffill
0替換成nan
一般情況下,0 替換成nan會寫成
df.replace(0, None, inplace=True)
然而替換不了,應(yīng)該是這樣的
df.replace(0, np.nan, inplace=True)
nan替換成前值后值
df.ffill(axis=0) # 用前一個(gè)值替換 df.bfill(axis=0) # 用后一個(gè)值替換
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Pandas 缺失數(shù)據(jù)處理的實(shí)現(xiàn)
這篇文章主要介紹了Pandas 缺失數(shù)據(jù)處理的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11
Python實(shí)現(xiàn)將藍(lán)底照片轉(zhuǎn)化為白底照片功能完整實(shí)例
這篇文章主要介紹了Python實(shí)現(xiàn)將藍(lán)底照片轉(zhuǎn)化為白底照片功能,結(jié)合完整實(shí)例形式分析了Python基于cv2庫進(jìn)行圖形轉(zhuǎn)換操作的相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下2019-12-12
使用keras內(nèi)置的模型進(jìn)行圖片預(yù)測實(shí)例
這篇文章主要介紹了使用keras內(nèi)置的模型進(jìn)行圖片預(yù)測實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
TF-IDF與余弦相似性的應(yīng)用(二) 找出相似文章
這篇文章主要為大家詳細(xì)介紹了TF-IDF與余弦相似性的應(yīng)用,找出相似文章,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-12-12
pyqt5利用pyqtDesigner實(shí)現(xiàn)登錄界面
這篇文章主要為大家詳細(xì)介紹了pyqt5利用pyqtDesigner實(shí)現(xiàn)登錄界面,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-03-03
python獲得linux下所有掛載點(diǎn)(mount points)的方法
這篇文章主要介紹了python獲得linux下所有掛載點(diǎn)(mount points)的方法,涉及Python操作Linux下掛載點(diǎn)的相關(guān)技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-04-04
python 在threading中如何處理主進(jìn)程和子線程的關(guān)系
這篇文章主要介紹了python 在threading中如何處理主進(jìn)程和子線程的關(guān)系,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04

