Python3.6使用tesseract-ocr的正確方法
Tesseract介紹
tesseract是一個挺不錯的OCR引擎,目前的問題是最新的中文資料相對較少,過時、不準確的信息偏多。
tesseract是一個google支持的開源ocr項目,其項目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源碼可以在這里下載。
實際使用tesseract ocr也有兩種方式:1. 動態(tài)庫方式 libtesseract 2. 執(zhí)行程序方式 tesseract.exe
環(huán)境
- Python 3.6.3
- pip 9.0.1
- tesseract-ocr-setup-3.05.00dev.exe
- Windows10
安裝
1.tesseract-orc
- Tesseract:開源的OCR識別引擎,初期Tesseract引擎由HP實驗室研發(fā),后來貢獻給了開源軟件業(yè),后經由Google進行改進,消除bug,優(yōu)化,重新發(fā)布。
安裝的時候需要自行選擇安裝的語言,一些其他國家的語言可以不選擇安裝,我之按安裝了中文,英文和日語。安裝過程和其他軟件一樣。
2.pytesseract
pip install pytesseract
配置環(huán)境
1.設置 tesseract-orc路徑
默認情況下tesseract-orc是不被添加到系統(tǒng)的path路徑的,這樣在使用的時候發(fā)生FileNotFoundError: [WinError 2] 系統(tǒng)找不到指定的文件錯誤。
解決方法:
- 方法1:將 C:\Program Files (x86)\Tesseract-OCR添加到系統(tǒng)路徑(路徑因安裝過程而異)
- 方法2:修改pytesseract.py文件
設置訓練集的位置
下載的默認訓練集也沒有添加到系統(tǒng)路徑,會報錯
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\tessdata/chi_sim.traineddata')
解決方法:
設置環(huán)境變量 TESSDATA_PREFIX
C:\Program Files (x86)\Tesseract-OCR\tessdata
實例程序
import pytesseract
from PIL import Image
image = Image.open('test.png')
code = pytesseract.image_to_string(image)
print(code)
更多參考:https://pypi.python.org/pypi/pytesseract
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內容請查看下面相關鏈接
相關文章
Python socket實現(xiàn)多對多全雙工通信的方法
今天小編就為大家分享一篇Python socket實現(xiàn)多對多全雙工通信的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-02-02
Python+Django+MySQL實現(xiàn)基于Web版的增刪改查的示例代碼
這篇文章主要介紹了Python+Django+MySQL實現(xiàn)基于Web版的增刪改查的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-05-05
Python基于matplotlib實現(xiàn)繪制三維圖形功能示例
這篇文章主要介紹了Python基于matplotlib實現(xiàn)繪制三維圖形功能,涉及Python使用matplotlib模塊進行三維圖形繪制相關操作技巧,需要的朋友可以參考下2018-01-01
如何用python復制粘貼excel指定單元格(可保留格式)
這篇文章主要給大家介紹了關于如何用python復制粘貼excel指定單元格(可保留格式)的相關資料,利用python操作excel非常方便,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2023-07-07
Selenium 模擬瀏覽器動態(tài)加載頁面的實現(xiàn)方法
這篇文章主要介紹了Selenium 模擬瀏覽器動態(tài)加載頁面的實現(xiàn)方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-05-05

