Python如何提取chm數(shù)據(jù)
Python提取chm數(shù)據(jù)
需求場景
chm格式文檔中的內(nèi)容,提取保存為html
- 方法一 使用在線轉(zhuǎn)換工具或者軟件
- 方法二 腳本編譯
step 1:.bat腳本反編譯
使用該腳本, 可以將chm文件反編譯,類似解壓,獲取文件。有些文檔可以直接轉(zhuǎn)換為txt,有些會轉(zhuǎn)化為html. 這個跟生成chm文件有關系。
1 新建txt文檔, 參照示例寫入命令。保存后文件另存為.bat格式
hh -decompile 轉(zhuǎn)換結(jié)果輸出路徑 待轉(zhuǎn)換文件(相對/絕對路徑) # 示例 hh -decompile D:\Desktop\ 123.chm
2 右鍵 管理員身份運行該文件即可,結(jié)果輸出到命令指定的目錄
step 2: html轉(zhuǎn)txt
【html】Python提取html中文本到txt
查用python自帶的.chm官方文檔
1.去python的官方網(wǎng)站去下載對應版本的python,在這里下載的python會自帶一份官方文檔(根據(jù)操作系統(tǒng)選擇的不同,會有不同的格式),下載windows版本的會有一個(*.chm)格式的說明文檔


下載好后進入下載目錄,找到Doc目錄,進入
我的是windows系統(tǒng),可以看到有個5-6兆的(*.chm)說明文檔
windows下可以直接雙擊打開。

打開后的樣子,可以看到很多目錄,充滿了知識,等待著去發(fā)掘。

如果我對python自帶的某個庫的使用十分不解,比如copy,
我應該這樣查



想找python基本的數(shù)據(jù)類型以及使用來學習
可以這樣來找

python自帶的(內(nèi)建的)函數(shù)有很多,了解一下

python自帶了的各種異常,快來捕獲吧

python語言是一種解釋型語言,很大程度上解決了跨平臺開發(fā)的難度,關于python的各種接口(interface)調(diào)用,以及對操作系統(tǒng)的支持,都可以查到。

關于英語的問題,大可不必擔心,有道云翻譯提供截屏翻譯,鼠標取詞翻譯,是十分方便的,快去學習吧!


總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Pycharm配置Anaconda環(huán)境的詳細圖文教程
PyCharm是一款很好用很流行的python編輯器,Anaconda通過管理工具包、開發(fā)環(huán)境、Python版本,大大簡化了你的工作流程,下面這篇文章主要給大家介紹了關于Windows系統(tǒng)下Pycharm配置Anaconda環(huán)境的相關資料,需要的朋友可以參考下2023-02-02
python讀寫數(shù)據(jù)讀寫csv文件(pandas用法)
這篇文章主要介紹了python讀寫數(shù)據(jù)讀寫csv文件(pandas用法),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-12-12
Python解決兩個整數(shù)相除只得到整數(shù)部分的實例
今天小編就為大家分享一篇Python解決兩個整數(shù)相除只得到整數(shù)部分的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11
python3使用diagrams繪制架構(gòu)圖的步驟
這篇文章主要介紹了python3使用diagrams生成架構(gòu)圖的步驟,幫助大家更好的理解和學習使用python,感興趣的朋友可以了解下2021-04-04
Python(TensorFlow框架)實現(xiàn)手寫數(shù)字識別系統(tǒng)的方法
這篇文章主要介紹了Python(TensorFlow框架)實現(xiàn)手寫數(shù)字識別系統(tǒng)的方法。小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-05-05
python利用多種方式來統(tǒng)計詞頻(單詞個數(shù))
這篇文章主要介紹了python利用多種方式來統(tǒng)計詞頻(單詞個數(shù)),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-05-05
Python scikit-learn數(shù)據(jù)預處理常見方法和步驟
數(shù)據(jù)預處理是數(shù)據(jù)準備階段的一個重要環(huán)節(jié),主要目的是將原始數(shù)據(jù)轉(zhuǎn)換成適合機器學習模型使用的格式,數(shù)據(jù)預處理可以顯著提高機器學習模型的性能和準確度,本文給大家介紹了Python數(shù)據(jù)預處理常見方法和步驟,需要的朋友可以參考下2024-05-05

