使用pd.merge表連接出現(xiàn)多余行的問題解決
本文的目標是將表1論文及出版物與表2出版物及其指標進行匹配。


利用pandas的merge函數(shù)實現(xiàn)表的左外連接。左外連接即左表的外連接,左表保持不變,匹配右表的行(合并后右表肯能存在空值)。
paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
how='left',left_on='出版物',right_on='名稱',sort=False)
結(jié)果發(fā)現(xiàn)連接后表相比于表1論文出版物 多出來13行。進行探究發(fā)現(xiàn)是表2出版物指標信息中存在 出版物A-指標1,出版物A-指標2這樣的出版物重復(fù)行。進行匹配后會出現(xiàn):
出版物 名稱 指標 出版物A 出版物A 指標1 出版物A 出版物A 指標2 #多余的行
這里選擇預(yù)先刪除 表2出版物指標 中的重復(fù)出版物信息。
publicationIndicator.drop_duplicates(subset=['名稱'], keep='first',inplace=True)
這樣結(jié)果就沒有問題了。
到此這篇關(guān)于使用pd.merge表連接出現(xiàn)多余行的問題解決的文章就介紹到這了,更多相關(guān)pd.merge表連接多余行問題內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pytorch如何把Tensor轉(zhuǎn)化成圖像可視化
這篇文章主要介紹了Pytorch如何把Tensor轉(zhuǎn)化成圖像可視化問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-12-12
Python分割單詞和轉(zhuǎn)換命名法的實現(xiàn)
本文主要介紹了Python分割單詞和轉(zhuǎn)換命名法的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-03-03
python列表返回重復(fù)數(shù)據(jù)的下標
這篇文章主要介紹了python列表返回重復(fù)數(shù)據(jù)的下標,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-02-02
解決Alexnet訓(xùn)練模型在每個epoch中準確率和loss都會一升一降問題
這篇文章主要介紹了解決Alexnet訓(xùn)練模型在每個epoch中準確率和loss都會一升一降問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
基于python編寫監(jiān)控系統(tǒng)各項資源的腳本
這篇文章主要為大家詳細介紹了如何編寫一個python腳本,實現(xiàn)監(jiān)控網(wǎng)絡(luò)的流量、CPU使用率、內(nèi)存使用率和磁盤使用情況,感興趣的小伙伴可以了解下2023-11-11

