python解決pandas處理缺失值為空字符串的問題
踩坑記錄:
用pandas來做csv的缺失值處理時(shí)候發(fā)現(xiàn)奇怪BUG,就是excel打開csv文件,明明有的格子沒有任何東西,當(dāng)然,我就想到用pandas的dropna()或者fillna()來處理缺失值。
但是pandas讀取csv文件后發(fā)現(xiàn)那個(gè)空的地方isnull()竟然是false,就是說那個(gè)地方有東西。。。
后來經(jīng)過排查發(fā)現(xiàn)看似什么都沒有的地方有空字符串,故pandas認(rèn)為那兒不是缺失值,所以就不能用dropna()或者fillna()來處理。
解決思路:先用正則將空格匹配出來,然后全部替換為NULL,再在用pandas讀取csv時(shí)候指定 read_csv(na_values='NULL')就是將NULL認(rèn)為是nan處理,接下來就可以用dropna()或者fillna()來處理了
以上這篇python解決pandas處理缺失值為空字符串的問題就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python腳本監(jiān)聽域名證書過期時(shí)間并通知消息到釘釘(最新推薦)
這篇文章主要介紹了python腳本監(jiān)聽域名證書過期時(shí)間并通知消息到釘釘(最新推薦),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-11-11
python pands實(shí)現(xiàn)execl轉(zhuǎn)csv 并修改csv指定列的方法
今天小編就為大家分享一篇python pands實(shí)現(xiàn)execl轉(zhuǎn)csv 并修改csv指定列的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-12-12
python datetime 和時(shí)間戳互相轉(zhuǎn)換問題
time和datetime都是Python中的內(nèi)置模塊(不需要安裝,直接可以使用),都可以對(duì)時(shí)間進(jìn)行獲取,對(duì)時(shí)間格式進(jìn)行轉(zhuǎn)換,如時(shí)間戳和時(shí)間字符串的相互轉(zhuǎn)換,本文先給大家介紹python datetime 和時(shí)間戳互轉(zhuǎn)問題,感興趣的朋友一起看看吧2022-11-11

