pandas實現(xiàn)一行拆分成多行
更新時間:2022年05月12日 09:39:56 作者:Jalen備忘錄
這篇文章主要介紹了pandas實現(xiàn)一行拆分成多行方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
一行拆分成多行
1.根據(jù)某一列拆分
效果:


代碼:
if __name__ == '__main__':
import pandas as pd
df = pd.DataFrame({'Country': ['China,US', 'Japan,EU', 'UK,Australia', 'Singapore,Netherland'],
'Number': [100, 150, 120, 90],
'Value': [1, 2, 3, 4],
'label': list('abcd')})
df_split_row = df.drop('Country', axis=1).join(
df['Country'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('Country'))2.根據(jù)多列拆分
效果:


代碼:
if __name__ == '__main__':
import pandas as pd
df = pd.DataFrame({'Code': ['212027'],
'Color': ['blue, pink, yellow'],
'Size': ['12-18M, 2-3Y, 3-4Y']})
split_columns = ['Color', 'Size']
df_convert = df.drop(columns=split_columns, axis=1)
for column in split_columns:
df_convert = df_convert.join(
df[column].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename(column))
df_convert = df_convert.reset_index(drop=True)一行轉(zhuǎn)多行、多行轉(zhuǎn)一行
1.測試數(shù)據(jù)
df = pd.DataFrame([['張世龍', '籃球、羽毛球、英雄聯(lián)盟'],
['黃邵飛', '兵乓球、足球、下棋'],
['劉苗苗', '繪畫、寫小說、跑步']])
df.columns = ['姓名','愛好']

2.一行轉(zhuǎn)多行
方法一:
# 1、把渠道字段拆分,分為多列; 2、把行轉(zhuǎn)列成列;3、重置索引,并刪除多于的索引;4、更改名稱
df_ = df['愛好'].str.split('、',expand=True).stack().reset_index(level=1,drop=True).rename('愛好')
df1 = df.drop(['愛好'], axis=1).join(df_)
方發(fā)二:
# 1、將渠道字段拆分;2、調(diào)用explode()方法
df['愛好'] = df['愛好'].map(lambda x:x.split('、'))
df1 = df.explode('愛好')

3.多行轉(zhuǎn)一行
#定義拼接函數(shù),并對字段進行去重
def concat_func(x):
return pd.Series({
'愛好':'、'.join(x['愛好'].unique())
})
#分組聚合 + 拼接
df2 = df1.groupby(df1['姓名']).apply(concat_func).reset_index()

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
tensorflow TFRecords文件的生成和讀取的方法
本篇文章主要介紹了tensorflow TFRecords文件的生成和讀取的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-02-02
基于Python實現(xiàn)音頻下載應(yīng)用程序
這篇文章主要介紹了如何使用wxPython、yt_dlp和tqdm庫,開發(fā)一個簡單直觀的用戶界面,并具備高效的音頻下載功能,感興趣的小伙伴可以學習一下2023-08-08
Python實現(xiàn)統(tǒng)計給定列表中指定數(shù)字出現(xiàn)次數(shù)的方法
這篇文章主要介紹了Python實現(xiàn)統(tǒng)計給定列表中指定數(shù)字出現(xiàn)次數(shù)的方法,涉及Python針對列表的簡單遍歷、計算相關(guān)操作技巧,需要的朋友可以參考下2018-04-04
python中l(wèi)eastsq函數(shù)的使用方法
這篇文章主要介紹了python中l(wèi)eastsq函數(shù)的使用方法,leastsq作用是最小化一組方程的平方和,下面文章舉例說明詳細內(nèi)容,具有一的參考價值,需要的小伙伴可以參考一下2022-03-03
詳解解決Python memory error的問題(四種解決方案)
這篇文章主要介紹了詳解解決Python memory error的問題(四種解決方案),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-08-08

