python中pandas.DataFrame排除特定行方法示例
前言
大家在使用Python進(jìn)行數(shù)據(jù)分析時(shí),經(jīng)常要使用到的一個(gè)數(shù)據(jù)結(jié)構(gòu)就是pandas的DataFrame,關(guān)于python中pandas.DataFrame的基本操作,大家可以查看這篇文章。
pandas.DataFrame排除特定行
如果我們想要像Excel的篩選那樣,只要其中的一行或某幾行,可以使用isin()方法,將需要的行的值以列表方式傳入,還可以傳入字典,指定列進(jìn)行篩選。
但是如果我們只想要所有內(nèi)容中不包含特定行的內(nèi)容,卻并沒有一個(gè)isnotin()方法。我今天的工作就遇到了這樣的需求,經(jīng)常查找之后,發(fā)現(xiàn)只能換種方式使用isin()來實(shí)現(xiàn)這個(gè)需求。
示例如下:
In [3]: df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB' ...: , 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2 ...: ', 'p3']) In [4]: df Out[4]: p1 p2 p3 0 GD GX FJ 1 SD SX BJ 2 HN HB AH 3 HEN HEN HLJ 4 SH TJ CQ
如果只想要p1為GD和HN的兩行,可以這么做:
In [8]: df[df.p1.isin(['GD', 'HN'])] Out[8]: p1 p2 p3 0 GD GX FJ 2 HN HB AH
但是如果我們想要除了這兩行之外的數(shù)據(jù),就需要繞點(diǎn)路了。
原理是先把p1取出并轉(zhuǎn)換為列表,然后再從列表中去不需要的行(值)去除,然后再在DataFrame中使用isin()
In [9]: ex_list = list(df.p1)
In [10]: ex_list.remove('GD')
In [11]: ex_list.remove('HN')
In [12]: ex_list
Out[12]: ['SD', 'HEN', 'SH']
In [13]: df[df.p1.isin(ex_list)]
Out[13]:
p1 p2 p3
1 SD SX BJ
3 HEN HEN HLJ
4 SH TJ CQ
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者使用python能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
相關(guān)文章
Python中Arrow庫的時(shí)間操作技法總結(jié)
Arrow是一個(gè)功能強(qiáng)大、易用且具有優(yōu)雅設(shè)計(jì)的Python日期時(shí)間庫,它建立在Python的datetime模塊之上,旨在彌補(bǔ)datetime模塊在處理日期時(shí)間時(shí)的一些不足之處,下面我們就來了解一下Arrow庫的常見時(shí)間操作吧2023-12-12
tensorflow2.0的函數(shù)簽名與圖結(jié)構(gòu)(推薦)
這篇文章主要介紹了tensorflow2.0的函數(shù)簽名與圖結(jié)構(gòu),本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-04-04
Django中數(shù)據(jù)庫遷移常用的命令小結(jié)
在Django中數(shù)據(jù)庫遷移用于保持?jǐn)?shù)據(jù)庫結(jié)構(gòu)與模型定義同步,這篇文章主要介紹了Django中數(shù)據(jù)庫遷移常用的命令,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下2025-03-03
如何利用python創(chuàng)建、讀取和修改CSV數(shù)據(jù)文件
csv文件與txt文件類似,區(qū)別點(diǎn)就是在csv文件中,字段間使用“,”或“|”隔開,達(dá)到類似與表格的效果,下面這篇文章主要給大家介紹了關(guān)于如何利用python創(chuàng)建、讀取和修改CSV數(shù)據(jù)文件的相關(guān)資料,需要的朋友可以參考下2022-05-05

