pandas is in和not in的使用說明
簡介
pandas按條件篩選數(shù)據(jù)時(shí),除了使用query()方法,還可以使用isin和對isin取反進(jìn)行條件篩選.
代碼
import pandas as pd
df = pd.DataFrame({'a':[1, 2, 3, 4, 5, 6],
'b':[1, 2, 3, 4, 5, 6],
'c':[1, 2, 3, 4, 5, 6]})
filter_condition = {'a':[1, 2, 3]}
df_in = df[df.isin(filter_condition)['a']]
df_notin = df[~df.isin(filter_condition)['a']]
df.isin(filter_condition)
a b c
0 True True False
1 True True False
2 True False False
3 False False False
4 False False False
5 False False False

使用總結(jié)
pandas使用isin時(shí),返回DataFrame中存儲(chǔ)的數(shù)據(jù)為是否滿足篩選條件的boolean,可以通過boolean對DataFrame對數(shù)據(jù)進(jìn)行篩選。
補(bǔ)充:pandas中isin()函數(shù)及其逆函數(shù)使用
我使用這個(gè)函數(shù)就是用來清洗數(shù)據(jù),刪選過濾掉DataFrame中一些行。
布爾索引
這里你需要知道DateFrame中布爾索引這個(gè)東西,可以用滿足布爾條件的列值來過濾數(shù)據(jù),如下
>>> df=pd.DataFrame(np.random.randn(4,4),columns=['A','B','C','D']) >>> df A B C D 0 -0.018330 2.093506 -0.086293 -2.150479 1 0.104931 -0.271810 -0.054599 0.361612 2 0.590216 0.218049 0.157213 0.643540 3 -0.254449 -0.593278 -0.150455 -0.244485 >>> df.A>0#布爾索引 0 False 1 True 2 True 3 False Name: A, dtype: bool #布爾索引應(yīng)用 >>> df[df.A>0] A B C D 1 0.104931 -0.271810 -0.054599 0.361612 2 0.590216 0.218049 0.157213 0.643540 >>>
isin()
添加一列E
>>> df['E']=['a','a','c','b'] >>> df A B C D E 0 -0.018330 2.093506 -0.086293 -2.150479 a 1 0.104931 -0.271810 -0.054599 0.361612 a 2 0.590216 0.218049 0.157213 0.643540 c 3 -0.254449 -0.593278 -0.150455 -0.244485 b >>> df.E.isin(['a','c']) 0 True 1 True 2 True 3 False Name: E, dtype: bool >>> df.isin(['b','c'])#整個(gè)df也同樣適用 A B C D E 0 False False False False False 1 False False False False False 2 False False False False True 3 False False False False True #應(yīng)用 >>> df[df.E.isin(['a','c'])] A B C D E 0 -0.018330 2.093506 -0.086293 -2.150479 a 1 0.104931 -0.271810 -0.054599 0.361612 a 2 0.590216 0.218049 0.157213 0.643540 c >>>
isin()接受一個(gè)列表,判斷該列中元素是否在列表中。
同時(shí)對多個(gè)列過濾,可以如下使用
df[df[某列].isin(條件)&df[某列].isin(條件)] #應(yīng)用 >>> df.D=[0,1,0,2] >>> df[df.E.isin(['a','d'])&df.D.isin([0,])] A B C D E 0 -0.01833 2.093506 -0.086293 0 a
也可以
不推薦,你試一下就知道
df.isin({
'某列':[條件],
'某列':[條件],
})
#應(yīng)用
>>> df.D=[0,1,0,2]
>>> df
A B C D E
0 -0.018330 2.093506 -0.086293 0 a
1 0.104931 -0.271810 -0.054599 1 a
2 0.590216 0.218049 0.157213 0 c
3 -0.254449 -0.593278 -0.150455 2 b
>>> df[df.isin({'D':[0,3],'E':['a','d']})]
A B C D E
0 NaN NaN NaN 0.0 a
1 NaN NaN NaN NaN a
2 NaN NaN NaN 0.0 NaN
3 NaN NaN NaN NaN NaN
#沒錯(cuò)這不適合選出一行
>>> df.isin({'D':[0,3],'E':['a','d']})
A B C D E
0 False False False True True
1 False False False False True
2 False False False True False
3 False False False False False
isin()的逆函數(shù)
告訴你沒有isnotin,它的反函數(shù)就是在前面加上 ~ ,其他用法同上。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
python datetime 和時(shí)間戳互相轉(zhuǎn)換問題
time和datetime都是Python中的內(nèi)置模塊(不需要安裝,直接可以使用),都可以對時(shí)間進(jìn)行獲取,對時(shí)間格式進(jìn)行轉(zhuǎn)換,如時(shí)間戳和時(shí)間字符串的相互轉(zhuǎn)換,本文先給大家介紹python datetime 和時(shí)間戳互轉(zhuǎn)問題,感興趣的朋友一起看看吧2022-11-11
Python如何將兩個(gè)三維模型(obj)合成一個(gè)三維模型(obj)
這篇文章主要介紹了Python如何將兩個(gè)三維模型(obj)合成一個(gè)三維模型(obj)問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06
Python并發(fā)爬蟲常用實(shí)現(xiàn)方法解析
這篇文章主要介紹了Python并發(fā)爬蟲常用實(shí)現(xiàn)方法解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11
Python內(nèi)置方法實(shí)現(xiàn)字符串的秘鑰加解密(推薦)
在Python中實(shí)現(xiàn)AES算法需要借助的第三方庫Crypto,其在各個(gè)操作系統(tǒng)上的安裝方法有些許復(fù)雜,所以對于簡單的使用有點(diǎn)殺雞用牛刀的意思。這篇文章主要介紹了利用Python內(nèi)置方法實(shí)現(xiàn)字符串的秘鑰加解密,需要的朋友可以參考下2019-12-12
Python 中的判斷語句,循環(huán)語句,函數(shù)
這篇文章主要介紹了Python 中的判斷語句,循環(huán)語句,函數(shù),文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-08-08

