pandas 實(shí)現(xiàn)將重復(fù)表格去重,并重新轉(zhuǎn)換為表格的方法
在python處理數(shù)據(jù)時(shí),經(jīng)常用到DataFrame和set。
train=pd.read_csv('XXX.csv')#讀取文件
train=train['item_id']#選擇要去重的列
train=set(train)#去重
data=pd.DataFrame(list(train),columns=['item_id'])#因?yàn)閟et是無(wú)序的,必須要經(jīng)過(guò)list處理后才能成為DataFrame
data.to_csv('xxx.csv',index=False)#保存表格
記得導(dǎo)入pandas哦~
以上這篇pandas 實(shí)現(xiàn)將重復(fù)表格去重,并重新轉(zhuǎn)換為表格的方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python?pandas的八個(gè)生命周期總結(jié)
這篇文章主要從八個(gè)pandas的數(shù)據(jù)處理生命周期,整理匯總出pandas框架在整個(gè)數(shù)據(jù)處理過(guò)程中都是如何處理數(shù)據(jù)的,感興趣的小伙伴可以了解一下2022-10-10
Python寫(xiě)入MySQL數(shù)據(jù)庫(kù)的三種方式詳解
Python 讀取數(shù)據(jù)自動(dòng)寫(xiě)入 MySQL 數(shù)據(jù)庫(kù),這個(gè)需求在工作中是非常普遍的,主要涉及到 python 操作數(shù)據(jù)庫(kù),讀寫(xiě)更新等。本文總結(jié)了Python寫(xiě)入MySQL數(shù)據(jù)庫(kù)的三種方式,需要的可以參考一下2022-06-06
Python的collections模塊中namedtuple結(jié)構(gòu)使用示例
namedtuple顧名思義,就是名字+元組的數(shù)據(jù)結(jié)構(gòu),下面就來(lái)看一下Python的collections模塊中namedtuple結(jié)構(gòu)使用示例2016-07-07
Pandas中八個(gè)常用option設(shè)置的示例詳解
通過(guò)pandas的使用,我們經(jīng)常要交互式地展示表格(dataframe)、分析表格。本文整理了8個(gè)常用的配置選項(xiàng),使用可以提高很多效率,需要的可以參考一下2022-06-06
對(duì)比分析BN和dropout在預(yù)測(cè)和訓(xùn)練時(shí)區(qū)別
這篇文章主要為大家介紹了對(duì)比分析BN和dropout在預(yù)測(cè)和訓(xùn)練時(shí)區(qū)別,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05
Python使用sort和class實(shí)現(xiàn)的多級(jí)排序功能示例
這篇文章主要介紹了Python使用sort和class實(shí)現(xiàn)的多級(jí)排序功能,涉及Python基于面向?qū)ο蟮脑乇闅v、列表排序、添加等相關(guān)操作技巧,需要的朋友可以參考下2018-08-08

