Python對(duì)多屬性的重復(fù)數(shù)據(jù)去重實(shí)例
python中的pandas模塊中對(duì)重復(fù)數(shù)據(jù)去重步驟:
1)利用DataFrame中的duplicated方法返回一個(gè)布爾型的Series,顯示各行是否有重復(fù)行,沒有重復(fù)行顯示為FALSE,有重復(fù)行顯示為TRUE;
2)再利用DataFrame中的drop_duplicates方法用于返回一個(gè)移除了重復(fù)行的DataFrame。
注釋:
如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個(gè)方法默認(rèn)會(huì)判斷全部咧,如果在這兩個(gè)方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates(['state']),則指定部分列(state列)進(jìn)行重復(fù)項(xiàng)的判斷。
具體實(shí)例如下:
>>> import pandas as pd
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']}
>>> frame=pd.DataFrame(data)
>>> frame
pop state
0 a 1
1 b 1
2 c 2
3 d 2
>>> IsDuplicated=frame.duplicated()
>>> print IsDuplicated
0 False
1 False
2 False
3 False
dtype: bool
>>> frame=frame.drop_duplicates(['state'])
>>> frame
pop state
0 a 1
2 c 2
>>> IsDuplicated=frame.duplicated(['state'])
>>> print IsDuplicated
0 False
2 False
dtype: bool
>>>
以上這篇Python對(duì)多屬性的重復(fù)數(shù)據(jù)去重實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
- Python實(shí)現(xiàn)去除Excel重復(fù)數(shù)據(jù)并統(tǒng)計(jì)重復(fù)次數(shù)
- Python?生成多行重復(fù)數(shù)據(jù)的方法實(shí)現(xiàn)
- python列表返回重復(fù)數(shù)據(jù)的下標(biāo)
- python Django批量導(dǎo)入不重復(fù)數(shù)據(jù)
- python實(shí)現(xiàn)查找excel里某一列重復(fù)數(shù)據(jù)并且剔除后打印的方法
- python中查找excel某一列的重復(fù)數(shù)據(jù) 剔除之后打印
- Python-pandas返回重復(fù)數(shù)據(jù)的index問題
相關(guān)文章
python非對(duì)稱加密算法RSA實(shí)現(xiàn)原理與應(yīng)用詳解
RSA加密算法是一種非對(duì)稱加密算法,RSA算法的安全性基于大數(shù)分解的困難性,即已知兩個(gè)大素?cái)?shù)p和q的乘積n,求解p和q非常困難,RSA算法廣泛應(yīng)用于數(shù)據(jù)加密和數(shù)字簽名等領(lǐng)域,本文將詳細(xì)介紹如何在Python中使用RSA算法進(jìn)行加密和解密,需要的朋友可以參考下2024-09-09
python爬取拉勾網(wǎng)職位數(shù)據(jù)的方法
這篇文章主要介紹了python爬取拉勾網(wǎng)職位數(shù)據(jù)的實(shí)現(xiàn)方法,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2018-01-01
python中for循環(huán)輸出列表索引與對(duì)應(yīng)的值方法
今天小編就為大家分享一篇python中for循環(huán)輸出列表索引與對(duì)應(yīng)的值方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11
Python中通過property設(shè)置類屬性的訪問
為了達(dá)到類似C++類的封裝性能,可以使用property來設(shè)置Python類屬性的訪問權(quán)限,本文就介紹一下Python中通過property設(shè)置類屬性的訪問,感興趣的可以了解一下,感興趣的可以了解一下2023-09-09
Python中日期和時(shí)間的互相轉(zhuǎn)換操作方法
Python的datetime模塊提供了一套強(qiáng)大而靈活的工具,使我們能夠輕松地在不同的時(shí)間表示形式間相互轉(zhuǎn)換,并進(jìn)行復(fù)雜的時(shí)間計(jì)算,本文通過一個(gè)實(shí)用的例子向大家展示如何在Python中高效地進(jìn)行這些操作,感興趣的朋友一起看看吧2024-05-05
使用Python轉(zhuǎn)換Markdown文件為Word文檔
Markdown格式的文章轉(zhuǎn)換成Word文檔能夠幫助作者制作更復(fù)雜的文檔,同時(shí)確保內(nèi)容的一致性和美觀性,本文將使用Python實(shí)現(xiàn)Markdown轉(zhuǎn)Word,感興趣的可以了解下2024-11-11

