Python3 讀取Word文件方式
我的環(huán)境,Windows10,Python3.6.3
查詢了很多有關(guān)資料,發(fā)現(xiàn)都是Python2版本操作Word文件的,所以就寫了這篇短小的文章。
一、安裝 docx
pip install docx
完了之后,導入:import docx
發(fā)現(xiàn)報錯:ModuleNotFoundError: No module named ‘exceptions'
說沒有 exceptions 這個模塊,由于Python3已經(jīng)取消了這個模塊,而 PendingDeprecationWarning 是內(nèi)置
可以直接使用的,所以我們直接進入文件(這個要看你報錯顯示的路徑):
D:\ProgramFiles\Anaconda3\lib\site-packages\docx.py
把 from exceptions import PendingDeprecationWarning 注釋掉即可
示例代碼:
import docx
def get_docx(file_name):
d = docx.opendocx(file_name)
doc = docx.getdocumenttext(d)
return doc
doc = get_docx('tt.docx')
print(doc) # 輸出行數(shù):1075
for d in doc[:5]:
print(d) # 打印前5行
'''輸出:
一、補益之劑
1.四君子湯
四君子湯中和義,參術(shù)茯苓甘草比
益以夏陳名六君,祛痰補氣陽虛餌
除卻半夏名異功,或加香砂胃寒使
'''
以上這篇Python3 讀取Word文件方式就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
python生成多個只含0,1元素的隨機數(shù)組或列表的實例
今天小編就為大家分享一篇python生成多個只含0,1元素的隨機數(shù)組或列表的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11
Python+Selenium實現(xiàn)瀏覽器的控制操作
這篇文章主要為大家詳細介紹了Python+Selenium如何實現(xiàn)常見的瀏覽器控制操作,例如:瀏覽器參數(shù)設(shè)置、控制瀏覽器前進/后退等,感興趣的可以了解一下2022-09-09
運用Python快速的對MySQL數(shù)據(jù)庫進行重命名
本文介紹了如何運用Python快速的對現(xiàn)有的數(shù)據(jù)庫進行重命名,有此需求的朋友可以參考下2021-06-06
python和mysql交互操作實例詳解【基于pymysql庫】
這篇文章主要介紹了python和mysql交互操作,結(jié)合實例形式詳細分析了Python基于pymysql庫實現(xiàn)mysql數(shù)據(jù)庫的連接、增刪改查等各種常見操作技巧,需要的朋友可以參考下2019-06-06
python 網(wǎng)頁解析器掌握第三方 lxml 擴展庫與 xpath 的使用方法
這篇文章主要介紹了python 網(wǎng)頁解析器掌握第三方 lxml 擴展庫與 xpath 的使用方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-04-04

