Python3實現(xiàn)獲取圖片文字里中文的方法分析
本文實例講述了Python3實現(xiàn)獲取圖片文字里中文的方法。分享給大家供大家參考,具體如下:
一、運行環(huán)境
(1) win10
(2) pycharm
(3) python 3.5
(4) pillow與pytesseract庫安裝:
pip3 install pillow pip3 install pytesseract
(5) 識別引擎tesseract-ocr ,下載之后解壓安裝,下載地址:http://www.dhdzp.com/softs/538925.html
二、 運行代碼
# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是導包,只需要下面這一行就能實現(xiàn)圖片文字識別
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #設置為中文文字的識別
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng') #設置為英文或阿拉伯字母的識別
print(text)
三、報錯解決
1.FileNotFoundError:[WinError 2]系統(tǒng)找不到指定文件。
解決辦法:
打開文件pytesseract.py,找到如下代碼,將tesseract_cmd的值修改為全路徑,再次使用就不會報這個錯了。
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr
解決辦法:
打開文件pytesseract.py,找到image_to_string,指定config的參數(shù),如下:
tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):
更多關于Python相關內(nèi)容感興趣的讀者可查看本站專題:《Python數(shù)據(jù)結(jié)構與算法教程》、《Python編碼操作技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進階經(jīng)典教程》
希望本文所述對大家Python程序設計有所幫助。
相關文章
Django使用HTTP協(xié)議向服務器傳參方式小結(jié)
本文主要介紹了Django使用HTTP協(xié)議向服務器傳參方式小結(jié),用戶發(fā)送請求時攜帶的參數(shù)后端需要使用,而不同的發(fā)送參數(shù)的方式對應了不同的提取參數(shù)的方式,本文就詳細的介紹一下2021-08-08
python自動獲取微信公眾號最新文章的實現(xiàn)代碼
這篇文章主要介紹了python自動獲取微信公眾號最新文章,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-07-07

