python2與python3中關(guān)于對NaN類型數(shù)據(jù)的判斷和轉(zhuǎn)換方法
今天在對一堆新數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗的時(shí)候,遇到了一個(gè)這樣的問題:
ValueError: cannot convert float NaN to integer
一開始是這樣的,我用的jupyter是python35的,使用DataFrame讀入了數(shù)據(jù),其中有一列是year,默認(rèn)讀入時(shí)是將year這一列轉(zhuǎn)換為了float,所以就有了這樣的現(xiàn)象:

年份都是float類型了,看得我強(qiáng)迫癥都犯了。于是通過這樣的代碼來進(jìn)行強(qiáng)轉(zhuǎn),于是就報(bào)了上面的錯(cuò)誤了。
df.year = [int(y) for y in df.year]
簡單描述一下問題,其實(shí)就是NaN在python35中無法被強(qiáng)轉(zhuǎn)。
首先說一下,NaN類型在python25中在強(qiáng)轉(zhuǎn)int的時(shí)候默認(rèn)是轉(zhuǎn)換為0的,而在python25之后的版本再進(jìn)行轉(zhuǎn)換的時(shí)候就會報(bào)以上的錯(cuò)誤。
我們先打印看一下np.nan的類型:
print(type(np.nan))
<type 'float'>
np.nan是float類型,但是在進(jìn)行int轉(zhuǎn)換的時(shí)候就會報(bào)錯(cuò)。
解決方法:
使用is或者==進(jìn)行判斷是不是NaN,不是NaN進(jìn)行強(qiáng)轉(zhuǎn)int,是則用0代替。
先說一下==和is使用時(shí)的區(qū)別:
is和==都是對對象進(jìn)行比較判斷作用的,但對對象比較判斷的內(nèi)容并不相同。
如果有a跟b兩個(gè)變量,只有數(shù)值型和字符串型的情況下,a is b才為True,當(dāng)a和b是tuple,list,dict、set或者是實(shí)例化對象時(shí),a is b為False。
==是python標(biāo)準(zhǔn)操作符中的比較操作符,用來比較判斷兩個(gè)對象的value(值)是否相等。
通過下面的代碼可以看出,np.nan==np.nan結(jié)果是False,但是np.nan is np.nan卻是True。
a = np.nan print(a == np.nan) print(a == a) print(a is np.nan) print(a is a) False False True True
因此,通過每個(gè)元素與自身比較就可以解決了,代碼如下:
year = [] for y in df.year: if y == y: year.append(int(y)) else: year.append(0)
以上這篇python2與python3中關(guān)于對NaN類型數(shù)據(jù)的判斷和轉(zhuǎn)換方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python經(jīng)緯度坐標(biāo)轉(zhuǎn)換為距離及角度的實(shí)現(xiàn)
這篇文章主要介紹了Python經(jīng)緯度坐標(biāo)轉(zhuǎn)換為距離及角度的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11
python 使用sys.stdin和fileinput讀入標(biāo)準(zhǔn)輸入的方法
今天小編就為大家分享一篇python 使用sys.stdin和fileinput讀入標(biāo)準(zhǔn)輸入的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-10-10
在Mac OS上使用mod_wsgi連接Python與Apache服務(wù)器
這篇文章主要介紹了在Mac OS上使用mod_wsgi連接Python與Apache服務(wù)器的方法,同時(shí)文中還介紹了使用Python的Django框架時(shí)mod_wsgi連接方式下可能遇到的問題的一般解決方法,需要的朋友可以參考下2015-12-12

