python使用pandas處理excel文件轉(zhuǎn)為csv文件的方法示例
由于客戶提供的是excel文件,在使用時(shí)期望使用csv文件格式,且對(duì)某些字段內(nèi)容需要做一些處理,如從某個(gè)字段中固定的幾位抽取出來,獨(dú)立作為一個(gè)字段等,下面記錄下使用acaconda處理的過程;
import pandas
df = pandas.read_excel("/***/***.xlsx")
df.columns = [內(nèi)部為你給你的excel每一列自定義的名稱](比如我給我的excel自定義列表為:
["url","productName","***",。。。,"***"])
(下面開始你自己的表演,對(duì)每一列內(nèi)容進(jìn)行你自己需要的處理)
df["url"] = df["url"].str.replace("http", "https")
df["***"] = df["***"].str.replace("\n", " ")
df["stract_content"] = df["url"].str[-6:]
表演結(jié)束之后,就要保存了
df.drop_duplicates().fillna("").to_csv("/***/***.csv", index=False, encoding="utf-8", sep="\3")
上面為讀取路徑,下面為保存路徑
結(jié)束之后,可以通過
df.head(5)來查看結(jié)果前5個(gè),判斷處理結(jié)果是否符合你的預(yù)期即可;
下面總結(jié)一下將List內(nèi)容存儲(chǔ)到excel和csv:
直接上代碼:
list存儲(chǔ)到csv文件:下面代碼使用codes包操作
with codecs.open("result.csv", "w", encoding="utf-8") as fw:
for i in final_res:
fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
下面是使用pandas操作:
columns是字符串列表,作為表格的標(biāo)題頭
df = pandas.DataFrame(my_list)
df.columns = ["col1", "col2", ...]
df.to_excel("result.xlsx", index=False, encoding="utf-8")
也可以先存儲(chǔ)為csv文件,然后使用pandas轉(zhuǎn)化為excel:
with codecs.open("result.csv", "w", encoding="utf-8") as fw:
for i in final_res:
fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
with pandas.ExcelWriter('result.xlsx') as ew:
pandas.read_csv("result.csv", sep='\3').to_excel(ew, index=False, header=["文件名", "query調(diào)用時(shí)間", "調(diào)用ip", "調(diào)用類型", "query結(jié)束時(shí)間", "行序號(hào)", "top5 sku", "文件總耗時(shí)"], sheet_name="result", encoding="utf-8")
或者:
with codecs.open("result.csv", "w", encoding="utf-8") as fw:
for i in final_res:
fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
df = pandas.read_csv("result.csv", sep="\3")
df.columns = ["col1", "col2", ...]
df.to_excel("result.xlsx", index=False, encoding="utf-8")
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python中l(wèi)ogging日志模塊代碼調(diào)試過程詳解
這篇文章主要介紹了Python中l(wèi)ogging日志模塊代碼調(diào)試,今天來看看如何在代碼中定義日志,并探討日志的權(quán)限,需要的朋友可以參考下2023-04-04
超詳細(xì),教你用python語言實(shí)現(xiàn)QQ機(jī)器人制作教程
這篇文章主要介紹了如何python語言實(shí)現(xiàn)QQ機(jī)器人,用圖文詳細(xì)的描述了其中的操作步驟,非常的簡(jiǎn)單易上手,有需要的朋友可以參考下2021-08-08
Django 登陸驗(yàn)證碼和中間件的實(shí)現(xiàn)
這篇文章主要介紹了Django 登陸驗(yàn)證碼和中間件的實(shí)現(xiàn),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-08-08
python可迭代類型遍歷過程中數(shù)據(jù)改變會(huì)不會(huì)報(bào)錯(cuò)
這篇文章主要介紹了python可迭代類型遍歷過程中數(shù)據(jù)改變會(huì)不會(huì)報(bào)錯(cuò)問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12
Python函數(shù)遞歸調(diào)用實(shí)現(xiàn)原理實(shí)例解析
這篇文章主要介紹了Python函數(shù)遞歸調(diào)用實(shí)現(xiàn)原理過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08
使用python的pexpect模塊,實(shí)現(xiàn)遠(yuǎn)程免密登錄的示例
今天小編就為大家分享一篇使用python的pexpect模塊,實(shí)現(xiàn)遠(yuǎn)程免密登錄的示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-02-02
django model去掉unique_together報(bào)錯(cuò)的解決方案
本文給大家分享的是在使用django model去掉unique_together時(shí)報(bào)錯(cuò)的解決思路和具體步驟,提供給大家參考下,希望對(duì)大家學(xué)習(xí)使用django能夠有所幫助2016-10-10

