Python實(shí)現(xiàn)將Word表格嵌入到Excel中
今日需求

其實(shí)就是把Word中的表格轉(zhuǎn)到Excel中,順便做一個(gè)調(diào)整。這個(gè)需求在實(shí)際工作中,很多人還是經(jīng)常碰到的!
如果單單是兩個(gè)表格,那只要簡(jiǎn)單的復(fù)制黏貼即可,但如果上百了呢?那就得考慮自動(dòng)化了。好在今天碰到的需求中的原文件格式是比較有規(guī)律的,那直接來嘗試一下。
# 首先要pip install python-docx
# 如果原文件是doc格式,那就先轉(zhuǎn)成docx
from docx import Document
import pandas as pd
path = "./word表格轉(zhuǎn)excel.docx"
docx = Document(path)
table_s = docx.tables # 返回一個(gè)Table對(duì)象的列表
len(table_s) --> 2 # 返回值是2,因?yàn)樵募兄挥袃蓚€(gè)表格
list_ = [] # 初始化一個(gè)空列表,用來裝后面的dict_
for table in table_s: # 循環(huán)所有的表格列表
dict_ = {}
dict_['名稱'] = table.cell(0, 1).text # 表格的索引是從(0行,0列)開始
dict_['身份'] = table.cell(0, 3).text
dict_['簡(jiǎn)介'] = table.cell(1, 1).text
for i in range(3, len(table.rows)): # 后續(xù)的內(nèi)容格式不固定,所以循環(huán)獲取
dict_[table.cell(i, 0).text] = table.cell(i, 1).text
list_.append(dict_)
當(dāng)完成上述操作后,list_就會(huì)是一個(gè)字典列表。

接下來,將列表轉(zhuǎn)為DataFrame進(jìn)行操作即可。
df = pd.DataFrame(list_) # 先將前三列作為索引,然后逆透視其他列,其實(shí)這就是個(gè)一維表轉(zhuǎn)二維表的過程 df = df.set_index(['名稱', '身份', '簡(jiǎn)介']).stack(level=0).to_frame() # 重新設(shè)置一下行列索引的名字 df.index.names = ['名稱', '身份', '簡(jiǎn)介', '物質(zhì)'] df.columns = ['現(xiàn)狀']
此時(shí)的df就跟需求結(jié)果相差不大了。

最后將DataFrame導(dǎo)出,稍作美化即可完成需求。
# 導(dǎo)出的時(shí)候一定要設(shè)置index=True不然只會(huì)保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)
完整代碼?
# 首先要pip install python-docx
# 如果原文件是doc格式,那就先轉(zhuǎn)成docx
from docx import Document
import pandas as pd
path = "./word表格轉(zhuǎn)excel.docx"
docx = Document(path)
table_s = docx.tables # 返回一個(gè)Table對(duì)象的列表
list_ = [] # 初始化一個(gè)空列表,用來裝后面的dict_
for table in table_s: # 循環(huán)所有的表格列表
dict_ = {}
dict_['名稱'] = table.cell(0, 1).text # 表格的索引是從(0行,0列)開始的
dict_['身份'] = table.cell(0, 3).text
dict_['簡(jiǎn)介'] = table.cell(1, 1).text
for i in range(3, len(table.rows)): # 循環(huán)獲得后面的內(nèi)容
dict_[table.cell(i, 0).text] = table.cell(i, 1).text
list_.append(dict_)
df = pd.DataFrame(list_)
# 先將前三列作為索引,然后逆透視其他列,就是個(gè)一維表轉(zhuǎn)二維表的過程
df = df.set_index(['名稱', '身份', '簡(jiǎn)介']).stack(level=0).to_frame()
# 重新設(shè)置一下行列索引的名字
df.index.names = ['名稱', '身份', '簡(jiǎn)介', '物質(zhì)']
df.columns = ['現(xiàn)狀']
# 導(dǎo)出的時(shí)候一定要設(shè)置index=True不然只會(huì)保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)
到此這篇關(guān)于Python實(shí)現(xiàn)將Word表格嵌入到Excel中的文章就介紹到這了,更多相關(guān)Python Word表格嵌入Excel內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Keras Convolution1D與Convolution2D區(qū)別說明
這篇文章主要介紹了Keras Convolution1D與Convolution2D區(qū)別說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-05-05
python實(shí)現(xiàn)DES加密解密方法實(shí)例詳解
這篇文章主要介紹了python實(shí)現(xiàn)DES加密解密方法,以實(shí)例形式較為詳細(xì)的分析了基于Python實(shí)現(xiàn)的DES加密與解密技巧,需要的朋友可以參考下2015-06-06
Python中request庫(kù)的各種用法詳細(xì)解析
本文詳細(xì)介紹了Python的requests庫(kù)的安裝與使用,包括HTTP請(qǐng)求方法、請(qǐng)求頭、請(qǐng)求體的基本概念,以及發(fā)送GET和POST請(qǐng)求的基本用法,同時(shí),探討了會(huì)話對(duì)象、處理重定向、超時(shí)設(shè)置、代理支持等高級(jí)功能,幫助讀者更高效地處理復(fù)雜的HTTP請(qǐng)求場(chǎng)景,需要的朋友可以參考下2024-10-10
python 數(shù)字轉(zhuǎn)換為日期的三種實(shí)現(xiàn)方法
在Python中,我們經(jīng)常需要處理日期和時(shí)間,本文主要介紹了python 數(shù)字轉(zhuǎn)換為日期的三種實(shí)現(xiàn)方法,包含datetime模塊,strftime方法及pandas庫(kù),具有一定的參考價(jià)值,感興趣的可以了解一下2024-02-02
PIL包中Image模塊的convert()函數(shù)的具體使用
這篇文章主要介紹了PIL包中Image模塊的convert()函數(shù)的具體使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-02-02
完美解決python中ndarray 默認(rèn)用科學(xué)計(jì)數(shù)法顯示的問題
今天小編就為大家分享一篇完美解決python中ndarray 默認(rèn)用科學(xué)計(jì)數(shù)法顯示的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-07-07
Python實(shí)現(xiàn)動(dòng)態(tài)生成系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)到Word文檔
這篇文章主要為大家詳細(xì)介紹了如何利用Python實(shí)現(xiàn)填寫相關(guān)數(shù)據(jù)庫(kù)信息后,生成系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)到word文檔,文中示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2023-06-06

