Python實現(xiàn)識別圖片為文字的示例代碼

更新時間：2022年08月21日 08:02:40 作者：Sir?老王

這篇文章主要為大家詳細介紹了Python如何不調(diào)用三方收費接口，照樣實現(xiàn)識別圖片為文字的功能。文中的示例代碼講解詳細，感興趣的可以了解一下

1、環(huán)境準備

還是老規(guī)矩吧，像一些比較有歧義的環(huán)境準備工作，我都會將我使用到的python庫的版本列出來，防止小伙伴們走一些彎路。

操作系統(tǒng)：windows7

python版本：3.8.10

pytesseract版本：0.3.9

首先需要安裝兩個三方模塊，一個是PIL圖片處理庫，另一個是pytesseract識別文字用到的python庫。

pip?install?PIL?-i?https://pypi.tuna.tsinghua.edu.cn/simple/

pip?install?pytesseract?-i?https://pypi.tuna.tsinghua.edu.cn/simple/

安裝好這兩個python非標準庫以后，還有一個比較重要的操作就是需要額外的安裝一個工具Tesseract-OCR，這個工具實際上是我們用來識別圖片必須的一個工具。

為了防止丟失，我將Tesseract-OCR工具的安裝包和其需要的中文語言包放在了百度網(wǎng)盤中，在公眾號內(nèi)回復'Tesseract-OCR'工具可以獲取網(wǎng)盤下載鏈接感興趣的小伙伴直接去下載就好了。

下載完成以后直接進行解壓即可，解壓完成后的文件目錄是下面這樣的。

解壓完成后直接安裝Tesseract-OCR工具，雙擊打開就可以進行安裝了，傻瓜式安裝即可。

下面這個是我在給大家測試的時候截圖的一張安裝過程中的圖。

安裝完成后，我們需要將上面下載的中文包加入到安裝好的Tesseract-OCR工具主目錄下面的\tessdata文件夾中。

下面是我已經(jīng)將中文語言包放入到../Tesseract-OCR/tessdata文件中了。

中文語言包放好后，就可以直接進入下一步的操作了，那就是修改環(huán)境相關的配置，實際上只要需要一個相關的參數(shù)就OK了。

找到本地的python環(huán)境的安裝位置，找到我們前面安裝好的pytesseract的位置去修改參數(shù)一個叫做tesseract_cmd變量的值，具體操作是這樣的。

上面是我的pytesseract庫的安裝位置，找到之后打開pytesseract.py文件將tesseract_cmd變量的值替換為我們安裝的Tesseract-OCR工具的tesseract.exe應用程序的路徑。

默認Tesseract-OCR工具的安裝位置是下面這樣這個路徑，小伙伴們可以根據(jù)自己的位置設置。

C:/Program?Files?(x86)/Tesseract-OCR/tesseract.exe

這是我已經(jīng)修改好的pytesseract.py文件中tesseract_cmd變量的值。

tesseract_cmd?=?'C:/Program?Files?(x86)/Tesseract-OCR/tesseract.exe'

至此，準備工作終于做完了，接下來就是我們大顯身手的時間了，來輕松實現(xiàn)一個圖片到文字的轉(zhuǎn)換吧！

2、業(yè)務實現(xiàn)

代碼實現(xiàn)過程相當簡單，比較上面的安裝配置過程簡直就是小菜一碟了，導入相關的python模塊中實際上只需要一行代碼就可以實現(xiàn)將圖片內(nèi)容識別為文字了。

#?導入python非標準模塊
from?PIL?import?Image
import?pytesseract?as?pyt

#?讀取圖片中的文字內(nèi)容
text?=?pyt.image_to_string(Image.open('chinese-image.jpg'),?lang='chi_sim')

#?打印文字內(nèi)容
print(text)

3、效果展示

為了測試一下效果，我用本地的畫圖軟件畫了一張圖，圖片上寫上文字，文字內(nèi)容是：

大家好，我是 Python 集中營！下面是我的測試圖片。

下面執(zhí)行上面的圖片識別代碼塊產(chǎn)生的效果，直接一字不差的就將文字讀取的出來，簡直是滿滿的成就感，晚上可以好好睡個覺了，沒有bug的夢估計很甜！

# 大家好 , 我是 Python 集中營 !

到此這篇關于Python實現(xiàn)識別圖片為文字的示例代碼的文章就介紹到這了,更多相關Python識別圖片為文字內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python anaconda 安裝環(huán)境變量升級以及特殊庫安裝的方法
下面小編就為大家?guī)硪黄猵ython anaconda 安裝環(huán)境變量升級以及特殊庫安裝的方法。
2017-06-06
Pyqt5 關于流式布局和滾動條的綜合使用示例代碼
這篇文章主要介紹了Pyqt5 關于流式布局和滾動條的綜合使用示例代碼，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-03-03
Python安裝Imaging報錯：The _imaging C module is not installed問題解決
這篇文章主要介紹了Python安裝Imaging報錯：The _imaging C module is not installed問題解決方法,原來是PIL庫的庫文件沒有加到系統(tǒng)中導致老是提示這個錯誤,需要的朋友可以參考下
2014-08-08
Flask?的路由Route詳情
在上一篇Flask?入門Web?微框架Hello?Flask中，我們用?Flask?框架寫了一個?Hello?Flask?應用程序，我們了解到?Flask?框架簡潔高效、可以快速上手，接下來將對?Flask?框架的各項功能詳細的介紹一下，本篇文章介紹的是?Flask?的路由(Route),需要的朋友可以參考一下
2021-11-11
Python按條件刪除Excel表格數(shù)據(jù)的方法(示例詳解)
本文介紹基于Python語言,讀取Excel表格文件,基于我們給定的規(guī)則,對其中的數(shù)據(jù)加以篩選,將不在指定數(shù)據(jù)范圍內(nèi)的數(shù)據(jù)剔除,保留符合我們需要的數(shù)據(jù)的方法,感興趣的朋友跟隨小編一起看看吧
2024-08-08
Python必考的5道面試題集合
這篇文章介紹了Python必考的5道面試題，文中通過示例代碼介紹的非常詳細。對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2022-07-07
Python字典底層實現(xiàn)原理詳解
今天小編就為大家分享一篇Python字典底層實現(xiàn)原理詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-12-12
Python中字典的相關操作介紹
大家好，本篇文章主要講的是Python中字典的相關操作介紹，感興趣的同學趕快來看一看吧，對你有幫助的話記得收藏一下
2022-02-02
淺談插入排序算法在Python程序中的實現(xiàn)及簡單改進
這篇文章主要介紹了插入排序算法在Python程序中的實現(xiàn)及簡單改進,插入排序算法的最差時間復雜度為O(n^2),最優(yōu)時間復雜度為O(n),存在一定的優(yōu)化空間,需要的朋友可以參考下
2016-05-05
python八皇后問題的解決方法
這篇文章主要為大家詳細介紹了python八皇后問題的解決方法，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-09-09