Python3實現(xiàn)獲取圖片文字里中文的方法分析

更新時間：2018年12月13日 11:11:32 作者：huxiangen

這篇文章主要介紹了Python3實現(xiàn)獲取圖片文字里中文的方法,結(jié)合實例形式分析了Python基于文字識別引擎tesseract-ocr針對圖片里中文識別的相關操作技巧與操作注意事項,需要的朋友可以參考下

本文實例講述了Python3實現(xiàn)獲取圖片文字里中文的方法。分享給大家供大家參考，具體如下：

一、運行環(huán)境

(1) win10

(2) pycharm

(3) python 3.5

(4) pillow與pytesseract庫安裝：

pip3 install pillow
pip3 install pytesseract

(5) 識別引擎tesseract-ocr ，下載之后解壓安裝，下載地址：http://www.dhdzp.com/softs/538925.html

二、運行代碼

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是導包，只需要下面這一行就能實現(xiàn)圖片文字識別
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #設置為中文文字的識別
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')  #設置為英文或阿拉伯字母的識別
print(text)

三、報錯解決

1.FileNotFoundError:[WinError 2]系統(tǒng)找不到指定文件。

解決辦法：

打開文件pytesseract.py，找到如下代碼，將tesseract_cmd的值修改為全路徑，再次使用就不會報這個錯了。

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr

解決辦法：

打開文件pytesseract.py,找到image_to_string,指定config的參數(shù)，如下：

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):

更多關于Python相關內(nèi)容感興趣的讀者可查看本站專題：《Python數(shù)據(jù)結(jié)構與算法教程》、《Python編碼操作技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進階經(jīng)典教程》

希望本文所述對大家Python程序設計有所幫助。

您可能感興趣的文章:

跟老齊學Python之有容乃大的list(3)
現(xiàn)在是講lis的第三章了。俗話說，事不過三，不知道在開頭，我也不知道這一講是不是能夠把基礎的list知識講完呢。哈哈。其實如果真正寫文章，會在寫完之后把這句話刪掉的。而我則是完全像跟看官聊天一樣，就不刪除了。
2014-09-09
python實現(xiàn)打開手機app并點擊操作
這篇文章主要介紹了python實現(xiàn)打開手機app并點擊操作，本文分為兩部分一部分是打開應用，第二部分是調(diào)式手機連接電腦,需要的朋友可以參考下
2022-04-04
Python實現(xiàn)自動簽到腳本的示例代碼
這篇文章主要介紹了Python實現(xiàn)自動簽到腳本的示例代碼，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-08-08
python操作xlsx格式文件并讀取
python操作xlsx格式文件是比較常見的一個問題，本文給大家介紹xlrd庫讀取，pandas庫讀取的實例代碼，給大家講解的很詳細，需要的朋友跟隨小編一起看看吧
2021-06-06
Python 獲取當前所在目錄的方法詳解
本文給大家講解的是使用python獲取當前所在目錄的方法以及相關示例，非常的清晰簡單，有需要的小伙伴可以參考下
2017-08-08
Python中關于面向?qū)ο笾欣^承的詳細講解
面向?qū)ο缶幊?(OOP) 語言的一個主要功能就是“繼承”。繼承是指這樣一種能力：它可以使用現(xiàn)有類的所有功能，并在無需重新編寫原來的類的情況下對這些功能進行擴展
2021-10-10
Python隨機驗證碼生成和join?字符串的問題解析
Python中有join()和os.path.join()兩個函數(shù)，join是將字符串、元組、列表中的元素以指定的字符(分隔符)連接生成一個新的字符串而os.path.join()：?將多個路徑組合后返回，本文給大家介紹的非常詳細，需要的朋友一起看看吧
2022-04-04
Django使用HTTP協(xié)議向服務器傳參方式小結(jié)
本文主要介紹了Django使用HTTP協(xié)議向服務器傳參方式小結(jié)，用戶發(fā)送請求時攜帶的參數(shù)后端需要使用，而不同的發(fā)送參數(shù)的方式對應了不同的提取參數(shù)的方式，本文就詳細的介紹一下
2021-08-08
python自動獲取微信公眾號最新文章的實現(xiàn)代碼
這篇文章主要介紹了python自動獲取微信公眾號最新文章,本文通過實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2022-07-07
解決tensorflow打印tensor有省略號的問題
今天小編就為大家分享一篇解決tensorflow打印tensor有省略號的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02