Pandas 同元素多列去重的實例
更新時間:2018年07月03日 14:15:41 作者:迪小子
今天小編就為大家分享一篇Pandas 同元素多列去重的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
有一些問題可能會遇到同元素多列去重問題,下面介紹一種非常簡單效率也很快的做法,用pandas來實現(xiàn)。
首先我們看一下數據類型:
G1 G2 a b b a c d d c e f
對這樣的兩列數據進行同元素去重,最終得到結果為:
G1 G2 a b c d e f
代碼如下:
#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
tmp = sorted(i.split('|')) # The most important part,sort
p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')
以上這篇Pandas 同元素多列去重的實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
python通過SSH登陸linux并操作的實現(xiàn)
這篇文章主要介紹了python通過SSH登陸linux并操作的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-10-10
Python中CSV文件(逗號分割)實戰(zhàn)操作指南
CSV文件默認以英文逗號做為列分隔符,換行符作為行分隔符,下面這篇文章主要給大家介紹了關于Python中CSV文件(逗號分割)的相關資料,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下2022-07-07

