Python讀取word文本操作詳解
本文研究的主要問題時Python讀取word文本操作,分享了相關(guān)概念和實現(xiàn)代碼,具體如下。
一,docx模塊
Python可以利用python-docx模塊處理word文檔,處理方式是面向?qū)ο蟮摹R簿褪钦fpython-docx模塊會把word文檔,文檔中的段落、文本、字體等都看做對象,對對象進(jìn)行處理就是對word文檔的內(nèi)容處理。
二,相關(guān)概念
如果需要讀取word文檔中的文字(一般來說,程序也只需要認(rèn)識word文檔中的文字信息),需要先了解python-docx模塊的幾個概念。
1,Document對象,表示一個word文檔。
2,Paragraph對象,表示word文檔中的一個段落
3,Paragraph對象的text屬性,表示段落中的文本內(nèi)容。
三,模塊的安裝和導(dǎo)入
需要注意,python-docx模塊安裝需要在cmd命令行中輸入pip install python-docx,如下圖表示安裝成功(最后那句英文Successfully installed,成功地安裝完成,十分考驗英文水平。)

注意在導(dǎo)入模塊時,用的是import docx。
也真是奇了怪了,怎么安裝和導(dǎo)入模塊時,很多都不用一個名字,看來是很有必要出一個python版本的模塊管理程序python-maven了,本段純屬PS。
四,讀取word文本
在了解了上面的信息之后,就很簡單了,下面先創(chuàng)建一個D:\temp\word.docx文件,并在其中輸入如下內(nèi)容。

然后寫一段程序,代碼及輸出結(jié)果如下:
#讀取docx中的文本代碼示例
import docx
#獲取文檔對象
file=docx.Document("D:\\temp\\word.docx")
print("段落數(shù):"+str(len(file.paragraphs)))#段落數(shù)為13,每個回車隔離一段
#輸出每一段的內(nèi)容
for para in file.paragraphs:
print(para.text)
#輸出段落編號及段落內(nèi)容
for i in range(len(file.paragraphs)):
print("第"+str(i)+"段的內(nèi)容是:"+file.paragraphs[i].text)
運行結(jié)果:
================ RESTART: F:/360data/重要數(shù)據(jù)/桌面/學(xué)習(xí)筆記/readWord.py ================ 段落數(shù):13 啊 我看見一座山 雄偉的大山 真高啊 啊 這座山是! 真的很高! 第0段的內(nèi)容是:啊 第1段的內(nèi)容是: 第2段的內(nèi)容是:我看見一座山 第3段的內(nèi)容是: 第4段的內(nèi)容是:雄偉的大山 第5段的內(nèi)容是: 第6段的內(nèi)容是:真高啊 第7段的內(nèi)容是: 第8段的內(nèi)容是:啊 第9段的內(nèi)容是: 第10段的內(nèi)容是:這座山是! 第11段的內(nèi)容是: 第12段的內(nèi)容是:真的很高! >>>
總結(jié)
以上就是本文關(guān)于Python讀取word文本操作詳解的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
相關(guān)文章
用python實現(xiàn)一個簡單計算器(完整DEMO)
這篇文章主要介紹了用python實現(xiàn)一個簡單計算器(完整DEMO),需要的朋友可以參考下2020-10-10
python基于watchdog庫全自動化監(jiān)控目錄文件
這篇文章主要介紹了python基于watchdog庫全自動化監(jiān)控目錄文件,幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下2021-03-03
python Socket網(wǎng)絡(luò)編程實現(xiàn)C/S模式和P2P
這篇文章主要介紹了python Socket網(wǎng)絡(luò)編程實現(xiàn)C/S模式和P2P,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-06-06
Python使用matplotlib.pyplot畫熱圖和損失圖的代碼詳解
眾所周知,在完成論文相關(guān)工作時畫圖必不可少,如損失函數(shù)圖、熱力圖等是非常常見的圖,在本文中,總結(jié)了這兩個圖的畫法,下面給出了完整的代碼,開箱即用,感興趣的同學(xué)可以自己動手嘗試一下2023-09-09
一步一步教你用Python?pyglet仿制鴻蒙系統(tǒng)里的時鐘
pyglet是一個面向Python的跨平臺窗口、多媒體庫,它可以用于創(chuàng)建游戲和多媒體應(yīng)用程序,下面這篇文章主要給大家介紹了關(guān)于如何一步一步教你用Python?pyglet仿制鴻蒙系統(tǒng)里的時鐘,需要的朋友可以參考下2024-03-03
python使用mediapiple+opencv識別視頻人臉的實現(xiàn)
本文主要介紹了python使用mediapiple+opencv識別視頻人臉,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-03-03

