一次性徹底講透Python中pd.concat與pd.merge
數(shù)據(jù)的合并與關(guān)聯(lián)是數(shù)據(jù)處理過(guò)程中經(jīng)常遇到的問(wèn)題,在SQL、HQL中大家可能都有用到 join、uion all 等 ,在 Pandas 中也有同樣的功能,來(lái)滿足數(shù)據(jù)處理需求,個(gè)人感覺(jué) Pandas 處理數(shù)據(jù)還是非常方便,數(shù)據(jù)處理效率比較高,能滿足不同的業(yè)務(wù)需求
數(shù)據(jù)拼接:pd.concat
concat 是pandas級(jí)的函數(shù),用來(lái)拼接或合并數(shù)據(jù),其根據(jù)不同的軸既可以橫向拼接,又可以縱向拼接
函數(shù)參數(shù)
pd.concat(
objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]',
axis=0,
join='outer',
ignore_index: 'bool' = False,
keys=None,
levels=None,
names=None,
verify_integrity: 'bool' = False,
sort: 'bool' = False,
copy: 'bool' = True,
) -> 'FrameOrSeriesUnion'
objs:合并的數(shù)據(jù)集,一般用列表傳入,例如:[df1,df2,df3]axis:指定數(shù)據(jù)拼接時(shí)的軸,0是行,在行方向上拼接;1是列,在列方向上拼接join:拼接的方式有 inner,或者outer,與sql中的意思一樣
以上三個(gè)參數(shù)在實(shí)際工作中經(jīng)常使用,其他參數(shù)不再做介紹
案例:

模擬數(shù)據(jù)
橫向拼接

橫向拼接-1
字段相同的列進(jìn)行堆疊,字段不同的列分列存放,缺失值用NAN來(lái)填充,下面對(duì)模擬數(shù)據(jù)進(jìn)行變換用相同的字段,進(jìn)行演示

橫向拼接-2
縱向拼接

縱向拼接
可以看出在縱向拼接的時(shí)候,會(huì)按索引進(jìn)行關(guān)聯(lián),使相同名字的成績(jī)放在一起,而不是簡(jiǎn)單的堆疊
數(shù)據(jù)關(guān)聯(lián):pd.merge
數(shù)據(jù)關(guān)聯(lián)與SQL中的join基本一樣,一次可以關(guān)聯(lián)兩個(gè)數(shù)據(jù)表,有左表、右表的區(qū)分,需要可以指定關(guān)聯(lián)的字段
函數(shù)參數(shù)
pd.merge(
left: 'DataFrame | Series',
right: 'DataFrame | Series',
how: 'str' = 'inner',
on: 'IndexLabel | None' = None,
left_on: 'IndexLabel | None' = None,
right_on: 'IndexLabel | None' = None,
left_index: 'bool' = False,
right_index: 'bool' = False,
sort: 'bool' = False,
suffixes: 'Suffixes' = ('_x', '_y'),
copy: 'bool' = True,
indicator: 'bool' = False,
validate: 'str | None' = None,
) -> 'DataFrame'
left:左表right:右表how:關(guān)聯(lián)的方式,{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, 默認(rèn)關(guān)聯(lián)方式為 ‘inner’on:關(guān)聯(lián)時(shí)指定的字段,兩個(gè)表共有的left_on:關(guān)聯(lián)時(shí)用到左表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用right_on:關(guān)聯(lián)時(shí)用到右表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用
以上參數(shù)在實(shí)際工作中經(jīng)常使用,其他參數(shù)不再做介紹
案例:

數(shù)據(jù)關(guān)聯(lián)
merge 的使用與SQL中的 join 很像,使用方式基本一致,既有內(nèi)連接,也有外連接,用起來(lái)基本沒(méi)有什么難度
兩者區(qū)別
- concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法
- concat 可以橫向、縱向拼接,又起到關(guān)聯(lián)的作用
- merge 只能進(jìn)行關(guān)聯(lián),也就是縱向拼接
- concat 可以同時(shí)處理多個(gè)數(shù)據(jù)框DataFrame,而 merge 只能同時(shí)處理 2 個(gè)數(shù)據(jù)框
到此這篇關(guān)于一次性徹底講透Python中pd.concat與pd.merge的文章就介紹到這了,更多相關(guān)Python pd.concat與pd.merge內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python實(shí)現(xiàn)全排列代碼(回溯、深度優(yōu)先搜索)
今天小編就為大家分享一篇python實(shí)現(xiàn)全排列代碼(回溯、深度優(yōu)先搜索),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02
VScode中不同目錄間python庫(kù)函數(shù)的調(diào)用
本文主要介紹了VScode中不同目錄間python庫(kù)函數(shù)的調(diào)用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-03-03
一文詳解如何配置Pycharm進(jìn)行遠(yuǎn)程開(kāi)發(fā)
在搞深度學(xué)習(xí)的時(shí)候,我們?cè)诒镜亻_(kāi)發(fā),但是需要在服務(wù)器去運(yùn)行工程,所以需要使用Pycharm進(jìn)行遠(yuǎn)程配置,下面這篇文章主要給大家介紹了關(guān)于如何配置Pycharm進(jìn)行遠(yuǎn)程開(kāi)發(fā)的相關(guān)資料,需要的朋友可以參考下2024-02-02
基于Python實(shí)現(xiàn)條形碼圖片識(shí)別程序
這篇文章主要為大家詳細(xì)介紹了如何基于Python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的條形碼圖片識(shí)別程序,可以視頻圖片中的條形碼,感興趣的小伙伴可以跟隨小編學(xué)習(xí)一下2023-09-09
利用Anaconda簡(jiǎn)單安裝scrapy框架的方法
今天小編就為大家分享一篇利用Anaconda簡(jiǎn)單安裝scrapy框架的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-06-06
python判斷字符串以什么結(jié)尾的實(shí)例方法
在本篇文章里小編給大家整理了關(guān)于python判斷字符串以什么結(jié)尾的實(shí)例方法 ,需要的朋友們可以學(xué)習(xí)參考下。2020-09-09
CoordConv實(shí)現(xiàn)卷積加上坐標(biāo)實(shí)例詳解
這篇文章主要介紹了CoordConv實(shí)現(xiàn)卷積加上坐標(biāo)實(shí)例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03

