python如何實現(xiàn)word批量轉HTML
今天我們說一下使用python將word內容轉換成html文件。下面一起來看一下。
準備工作
使用python類庫PyDocX,安裝方法(使用pip進行安裝),命令如下:
pip install python-docx
類庫介紹
python-docx是用于創(chuàng)建和更新Microsoft Word(.docx)文件的Python庫。它可以針對word做很多操作。比如打開文件、寫入內容、編寫內容樣式、解析內容、讀取內容等等。主要就是針對word做的一款功能庫。
說代碼
下面一起來說一下代碼。首先是做了一個聲明的內容,主要是出現(xiàn)過代碼工具被網絡上的人給進行販賣,特此說了注釋。
1、通過os類庫,獲取當前目錄下的所有文件信息
# 當前目錄下的文件
file_path = os.getcwd()
print("當前位置:%s" % file_path)
2、通過函數(shù)進行獲取數(shù)據,并對目錄下文件進行判斷,只獲取.docx類型文檔
data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data
這里呢,我們做了一個判斷的操作,主要是防止文件名稱上出現(xiàn)空格的問題,因為在測試過程中發(fā)現(xiàn)了空格的文檔名稱是否沒有辦法找到文件的。
3、判斷數(shù)據情況
if not file_array:
print("此目錄下無docx格式word文件")
# 開始轉換
print("開始轉換")
for v in file_array:
main(v)
如果當前目錄下不含有符合的文檔,那么程序直接就跳出了,不再向下執(zhí)行了。
4、開始轉換
這里我們使用的是在3中循環(huán)調用方法,下面看一下代碼
html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()
整體來看轉換的方法很簡單,在類庫中已經幫我們做好的功能,只需要簡單的調用就可以了。我采用的是保持原有word文件名稱來生成html文件。這樣方便進行查找。
其實這里也可以不用生成文件的,可以將獲取的內容數(shù)據直接存入數(shù)據庫中,在頁面直接作出展示。
以上就是python如何實現(xiàn)word批量轉HTML的詳細內容,更多關于python word轉html的資料請關注腳本之家其它相關文章!
- python將html轉成PDF的實現(xiàn)代碼(包含中文)
- Python實現(xiàn)抓取HTML網頁并以PDF文件形式保存的方法
- Python實現(xiàn)將HTML轉成PDF的方法分析
- python 將html轉換為pdf的幾種方法
- Python3轉換html到pdf的不同解決方案
- Python實現(xiàn)html轉換為pdf報告(生成pdf報告)功能示例
- python包pdfkit(wkhtmltopdf)?將HTML轉換為PDF的操作方法
- Python實現(xiàn)批量將word轉html并將html內容發(fā)布至網站的方法
- 如何利用Python將html轉為pdf、word文件
相關文章
Python利用Django如何寫restful api接口詳解
這篇文章主要給大家介紹了關于Python利用Django如何寫restful api接口的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2018-06-06
自定義實現(xiàn) PyQt5 下拉復選框 ComboCheckBox的完整代碼
這篇文章主要介紹了自定義實現(xiàn) PyQt5 下拉復選框 ComboCheckBox的完整代碼,本文通過實例代碼講解的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03
Python實現(xiàn)數(shù)據可視化大屏布局的示例詳解
數(shù)據可視化大屏展示需求無疑是對數(shù)據分析結果最好的詮釋,能夠使得別人能夠輕松的就理解我們的數(shù)據意圖。本文將通過pyecharts模塊來實現(xiàn),感興趣的可以了解一下2022-11-11
pymongo為mongodb數(shù)據庫添加索引的方法
這篇文章主要介紹了pymongo為mongodb數(shù)據庫添加索引的方法,涉及Python操作mongodb數(shù)據庫的相關技巧,非常簡單實用,需要的朋友可以參考下2015-05-05

