利用Python的pandas數(shù)據(jù)處理包將寬表變成窄表

更新時間：2022年09月19日 16:57:44 作者：Joy_joye

這篇文章主要介紹了利用Python的pandas數(shù)據(jù)處理包將寬表變成窄表，文章通過圍繞主題展開詳細的內(nèi)容介紹，具有一定的參考價值，需要的小伙伴可以參考一下

前言

工作中經(jīng)常會使用到將寬表變成窄表，例如這樣的形式

編號

編碼

單位1

單位2

單位3

單位4

...

編碼1...

數(shù)量...

...

編碼2...

數(shù)量...

...

然而工作中，這樣查看數(shù)據(jù)不夠方便，往往需要窄表的形式，如下：

編碼	單位	數(shù)量
編碼1	單位1	數(shù)量1
編碼2	單位2	數(shù)量2

編碼3	單位3	數(shù)量3
......	......	......

嘗試使用Excel中的lookup函數(shù)進行填充，較為麻煩還不能直接實現(xiàn)功能，剛好在自學Python，就查閱了資料，看看能不能使用Python強大的數(shù)據(jù)處理功能來實現(xiàn)這個需求。

pandas簡介：pandas=pannel data+ data analysis;最初被作為金融數(shù)據(jù)分析工具而開發(fā)出來的，pandas為時間序列分析提供了很好的支持。同是也能夠靈活處理缺失數(shù)據(jù)，為數(shù)據(jù)分析操作提供了更為便捷的手段。

話不多說，直接上jupyter代碼。

1.引入包

供處理分析使用,這步so easy!

import pandas as pd
import numpy as np
import os

2.加載數(shù)據(jù)并顯示。常規(guī)操作。

data=pd.read_excel('test.xls')
data.head()

自己的測試數(shù)據(jù)存在test.xls中，這個文件存儲在路徑不必考慮，直接將原始存儲的文件在jupyter中點upload上傳到里根目錄里就可以。

顯示出來的，結果如圖所示:

3.關鍵操作，將寬表轉(zhuǎn)換為窄表

pd.set_option('display.max_rows', None)
df=pd.melt(data,id_vars="結算編碼",var_name="單位",value_name="數(shù)量")
df.head()

顯示結果如下，可以看到數(shù)據(jù)顯示不全，還有空值，需要進一步進行處理操作。

4.對空值進行處理

pd.set_option('display.max_rows', None)
#刪除所有值為空的行
df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False) 
#how字段可選有any和all,any表示只要有空值出現(xiàn)就刪除，all表示全部為空值才刪除；inplace字段表示是否替換掉原本的數(shù)據(jù)
#刪除所有值為空的列
df.dropna(axis="columns",how="all",inplace=False)
df.dropna()

處理后的結果可以看到，數(shù)據(jù)顯示齊全，并已過濾處理掉了空值。

5.導出存儲到Excel中

file_dir = 'D:/program/write/'
exists = os.path.exists(file_dir)
 
if not exists:
 
    os.makedirs(file_dir)
df["結算編碼"]  = df["結算編碼"].astype(str) #設置單元格格式
df.dropna().to_excel(os.path.join(file_dir,"result3.xlsx"), sheet_name="處理結果")

處理后的存儲結果：

結論：Python對數(shù)據(jù)處理分析真的操作簡單高效，后續(xù)可以多多嘗試使用Python來簡化辦公繁雜的程序，提升工作效率。

到此這篇關于利用Python的pandas數(shù)據(jù)處理包將寬表變成窄表的文章就介紹到這了,更多相關Python的pandas數(shù)據(jù)處理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

關于pyqt5彈出提示框的詳細介紹
在實際的程序開發(fā)中經(jīng)常會用到各種各樣的消息框來給用戶一些提示或提醒,下面這篇文章主要給大家介紹了關于pyqt5彈出提示框的詳細介紹,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下
2022-08-08
python+tkinter實現(xiàn)一個簡單的秒鐘
這篇文章主要為大家詳細介紹了Python如何利用tkinter實現(xiàn)一個簡單的秒鐘,文中的示例代碼講解詳細,具有一定的參考價值,感興趣的小伙伴可以自己動手嘗試一下
2024-02-02
Python django導出excel詳解
這篇文章主要介紹了Python django導出excel的方法，分享了相關代碼示例，小編覺得還是挺不錯的，具有一定借鑒價值，需要的朋友可以參考下
2021-11-11
Python高級property屬性用法實例分析
這篇文章主要介紹了Python高級property屬性用法,結合實例形式分析了Python property屬性的功能及各種常見的使用技巧,需要的朋友可以參考下
2019-11-11
Keras構建神經(jīng)網(wǎng)絡踩坑(解決model.predict預測值全為0.0的問題)
這篇文章主要介紹了Keras構建神經(jīng)網(wǎng)絡踩坑(解決model.predict預測值全為0.0的問題)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-07-07
django 利用Q對象與F對象進行查詢的實現(xiàn)
這篇文章主要介紹了django 利用Q對象與F對象進行查詢的實現(xiàn)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-05-05
利用Python定位Span標簽中文字的實戰(zhàn)指南
在網(wǎng)頁數(shù)據(jù)抓取和信息提取的過程中,經(jīng)常需要定位并獲取HTML中特定標簽的內(nèi)容,其中,<span>標簽是一個常見的內(nèi)聯(lián)元素,用于對文本進行分組或應用樣式,本文將詳細介紹如何使用Python來定位并提取<span>標簽中的文字,需要的朋友可以參考下
2024-12-12
python 一個figure上顯示多個圖像的實例
今天小編就為大家分享一篇python 一個figure上顯示多個圖像的實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-07-07
基于Python編寫一個監(jiān)控CPU的應用系統(tǒng)
在使用電腦辦公時，有時候不知道哪些軟件或進程會占用大量的資源，導致進行其他任務時出現(xiàn)變慢、卡頓等現(xiàn)象。因此，實時監(jiān)控系統(tǒng)的資源就變得非常重要。本文用Python編寫了一款超治愈的RunCat監(jiān)控應用系統(tǒng)，需要的可以參考一下
2022-06-06
教你學會通過python的matplotlib庫繪圖
今天教大家如何學會通過python的matplotlib庫繪圖,文中有非常詳細的圖文解說及代碼示例,對正在學習python的小伙伴們很有幫助,需要的朋友可以參考下
2021-05-05