pandas 讀取excel文件的操作代碼
一 read_excel() 的基本用法
import pandas as pd file_name = 'xxx.xlsx' pd.read_excel(file_name)
二 read_excel() 的常用的參數(shù):
io: excel路徑 可以是文件路徑, 類文件對象, 文件路徑對象等。
sheet_name=0: 訪問指定excel某張工作表。sheet_name可以是str, int, list 或 None類型, 默認(rèn)值是0。
str類型 是直接指定工作表的名稱
int類型 是指定從0開始的工作表的索引, 所以sheelt_name默認(rèn)值是0,即第一個(gè)工作表。
list類型 是多個(gè)索引或工作表名構(gòu)成的list,指定多個(gè)工作表。
None類型, 訪問所有的工作表
sheet_name=0: 得到的是第1個(gè)sheet的DataFrame類型的數(shù)據(jù)
sheet_name=2: 得到的是第3個(gè)sheet的DataFrame類型的數(shù)據(jù)
sheet_name=‘Test1': 得到的是名為'Test1'的sheet的DataFrame類型的數(shù)據(jù)
sheet_name=[0, 3, ‘Test5']: 得到的是第1個(gè),第4個(gè)和名為Test5 的工作表作為DataFrame類型的數(shù)據(jù)的字典。
header=0:header是標(biāo)題行,通過指定具體的行索引,將該行作為數(shù)據(jù)的標(biāo)題行,也就是整個(gè)數(shù)據(jù)的列名。默認(rèn)首行數(shù)據(jù)(0-index)作為標(biāo)題行,如果傳入的是一個(gè)整數(shù)列表,那這些行將組合成一個(gè)多級列索引。沒有標(biāo)題行使用header=None。
name=None: 傳入一列類數(shù)組類型的數(shù)據(jù),用來作為數(shù)據(jù)的列名。如果文件數(shù)據(jù)不包含標(biāo)題行,要顯式的指出header=None。
skiprows:int類型, 類列表類型或可調(diào)函數(shù)。 要跳過的行號(0索引)或文件開頭要跳過的行數(shù)(int)。如果可調(diào)用,可調(diào)用函數(shù)將根據(jù)行索引進(jìn)行計(jì)算,如果應(yīng)該跳過行則返回True,否則返回False。一個(gè)有效的可調(diào)用參數(shù)的例子是lambda x: x in [0, 1, 2]。
skipfooter=0: int類型, 默認(rèn)0。自下而上,從尾部指定跳過行數(shù)的數(shù)據(jù)。
usecols=None: 指定要使用的列,如果沒有默認(rèn)解析所有的列。
index_col=None: int或元素都是int的列表, 將某列的數(shù)據(jù)作為DataFrame的行標(biāo)簽,如果傳遞了一個(gè)列表,這些列將被組合成一個(gè)多索引,如果使用usecols選擇的子集,index_col將基于該子集。
squeeze=False, 布爾值,默認(rèn)False。 如果解析的數(shù)據(jù)只有一列,返回一個(gè)Series。
dtype=None: 指定某列的數(shù)據(jù)類型,可以使類型名或一個(gè)對應(yīng)列名與類型的字典,例 {‘A': np.int64, ‘B': str}
nrows=None: int類型,默認(rèn)None。 只解析指定行數(shù)的數(shù)據(jù)。
三 示例
如圖是演示使用的excel文件,它包含5張工作表。

1. IO:路徑
舉一個(gè)IO為文件對象的例子, 有些時(shí)候file文件路徑的包含較復(fù)雜的中文字符串時(shí),pandas 可能會解析文件路徑失敗,可以使用文件對象來解決。
file = 'xxxx.xlsx'
f = open(file, 'rb')
df = pd.read_excel(f, sheet_name='Sheet1')
f.close() # 沒有使用with的話,記得要手動釋放。
# ------------- with模式 -------------------
with open(file, 'rb') as f:
df = pd.read_excel(f, sheet_name='Sheet1')
2. sheet_name:指定工作表名
sheet_name=‘Sheet', 指定解析名為"Sheet1"的工作表。返回一個(gè)DataFrame類型的數(shù)據(jù)。
df = pd.read_excel(file, sheet_name='Sheet1')

sheet_name=[0, 1, ‘Sheet1'], 對應(yīng)的是解析文件的第1, 2張工作表和名為"Sheet1"的工作表。它返回的是一個(gè)有序字典。結(jié)構(gòu)為{name:DataFrame}這種類型。
df_dict = pd.read_excel(file, sheet_name=[0,1,'Sheet1'])

sheet_name=None 會解析該文件中所有的工作表,返回一個(gè)同上的字典類型的數(shù)據(jù)。
df_dict = pd.read_excel(file, sheet_name=None)

3. header :指定標(biāo)題行
header是用來指定數(shù)據(jù)的標(biāo)題行,也就是數(shù)據(jù)的列名的。本文使用的示例文件具有中英文兩行列名,默認(rèn)header=0是使用第一行數(shù)據(jù)作為數(shù)據(jù)的列名。
df_dict = pd.read_excel(file, sheet_name='Sheet1')

header=1, 使用指定使用第二行的英文列名。
df_dict = pd.read_excel(file, sheet_name='Sheet1', header=1)

需要注意的是,如果不行指定任何行作為列名,或數(shù)據(jù)源是無標(biāo)題行的數(shù)據(jù),可以顯示的指定header=None來表明不使用列名。
df_dict = pd.read_excel(file, sheet_name='Sheet1', header=None)

4. names: 指定列名
指定數(shù)據(jù)的列名,如果數(shù)據(jù)已經(jīng)有列名了,會替換掉原有的列名。
df = pd.read_excel(file, sheet_name='Sheet1', names=list('123456789ABCDE'))

上圖是header=0默認(rèn)第一行中文名是標(biāo)題行,最后被names給替換了列名,如果只想使用names,而又對源數(shù)據(jù)不做任何修改,我們可以指定header=None
df = pd.read_excel(file, sheet_name='Sheet1', names=list('123456789ABCDE'), header=None)

5. index_col: 指定列索引
df = pd.read_excel(file, sheet_name='Sheet1', header=1, index_col=0)

6. skiprows:跳過指定行數(shù)的數(shù)據(jù)
df = pd.read_excel(file, sheet_name='Sheet1', skiprows=0)

df = pd.read_excel(file, sheet_name='Sheet1', skiprows=[1,3,5,7,9,])

header與skiprows在有些時(shí)候效果相同,例skiprows=5和header=5。因?yàn)樘^5行后就是以第六行,也就是索引為5的行默認(rèn)為標(biāo)題行了。需要注意的是skiprows=5的5是行數(shù),header=5的5是索引為5的行。
df = pd.read_excel(file, sheet_name='Sheet1', header=5)

df = pd.read_excel(file, sheet_name='Sheet1', skiprows=5)

7. skipfooter:省略從尾部的行數(shù)據(jù)
原始的數(shù)據(jù)有47行,如下圖所示:

從尾部跳過5行:
df = pd.read_excel(file, sheet_name='Sheet1', skipfooter=5)

8.dtype 指定某些列的數(shù)據(jù)類型
示例數(shù)據(jù)中,測試編碼數(shù)據(jù)是文本,而pandas在解析的時(shí)候自動轉(zhuǎn)換成了int64類型,這樣codes列的首位0就會消失,造成數(shù)據(jù)錯(cuò)誤,如下圖所示

指定codes列的數(shù)據(jù)類型:
df = pd.read_excel(file, sheet_name='Sheet1', header=1, dtype={'codes': str})

到此這篇關(guān)于pandas 讀取excel文件的文章就介紹到這了,更多相關(guān)pandas 讀取excel文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python用pyinstaller封裝exe雙擊后瘋狂閃退解決辦法
本文主要介紹了python用pyinstaller封裝exe雙擊后瘋狂閃退解決辦法,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-11-11
Python實(shí)現(xiàn)分割文件及合并文件的方法
這篇文章主要介紹了Python實(shí)現(xiàn)分割文件及合并文件的方法,涉及Python針對文件的分割與合并操作相關(guān)技巧,通過自定義函數(shù)split與join實(shí)現(xiàn)了文件的分割與合并操作,需要的朋友可以參考下2015-07-07
Python PyWebIO提升團(tuán)隊(duì)效率使用介紹
這篇文章主要為大家介紹了Python PyWebIO提升團(tuán)隊(duì)效率使用介紹,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-01-01
Python 數(shù)據(jù)可視化之Seaborn詳解
這篇文章主要介紹了Python數(shù)據(jù)可視化庫seaborn的使用總結(jié),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2021-11-11
Python實(shí)現(xiàn)矩陣加法和乘法的方法分析
這篇文章主要介紹了Python實(shí)現(xiàn)矩陣加法和乘法的方法,結(jié)合實(shí)例形式對比分析了Python針對矩陣的加法與乘法運(yùn)算相關(guān)操作技巧,需要的朋友可以參考下2017-12-12
Python爬蟲進(jìn)階之Beautiful Soup庫詳解
這篇文章主要介紹了Python爬蟲進(jìn)階之Beautiful Soup庫詳解,文中有非常詳細(xì)的代碼示例,對正在學(xué)習(xí)python爬蟲的小伙伴們有非常好的幫助,需要的朋友可以參考下2021-04-04

