python+Tesseract?OCR實(shí)現(xiàn)截屏識(shí)別文字
一、tesseract-ocr下載安裝
1、下載
以下是關(guān)于Tesseract的常用網(wǎng)址
下載地址:https://digi.bib.uni-mannheim.de/tesseract/
官方網(wǎng)站:https://github.com/tesseract-ocr/tesseract
官方文檔:https://github.com/tesseract-ocr/tessdoc
語(yǔ)言包地址:https://github.com/tesseract-ocr/tessdata

2、安裝tesseract-ocr
(1)選擇語(yǔ)言

(2)開(kāi)始安裝

(3)同意許可

(4)選擇安裝的用戶

(5)選擇附帶要安裝的語(yǔ)言包
此后會(huì)在安裝過(guò)程中會(huì)自動(dòng)從服務(wù)器下載該語(yǔ)言包。(這里不太建議勾選下載語(yǔ)言包,因?yàn)橄螺d速度實(shí)在太慢。本教程后續(xù)會(huì)介紹如何拓展語(yǔ)言包)
默認(rèn)即可。

(6)安裝位置

(7)開(kāi)始安裝

(8)安裝完成
3、安裝語(yǔ)言包
(1)下載安裝
https://github.com/tesseract-ocr/tessdata
項(xiàng)目較大,可以按需下載簡(jiǎn)體中文:

將下載的文件存放到該目錄:D:\Program Files\Tesseract-OCR\tessdata

注:若小伙伴無(wú)法科學(xué)上網(wǎng),可以從這里下載簡(jiǎn)體中文語(yǔ)言包:http://www.dhdzp.com/softs/538925.html
(2)測(cè)試
進(jìn)入到Tesseract OCR安裝目錄:
# 查看版本 PS D:\Program Files\Tesseract-OCR> .\tesseract.exe -v tesseract v5.3.0.20221214 leptonica-1.78.0 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0 Found AVX2 Found AVX Found FMA Found SSE4.1 Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5 Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0 # 查看安裝的語(yǔ)言包 PS D:\Program Files\Tesseract-OCR> .\tesseract.exe --list-langs List of available languages in "D:\Program Files\Tesseract-OCR/tessdata/" (4): chi_sim chi_sim_vert eng osd
二、python截屏識(shí)別文字
1、安裝必須的包
pip install pyautogui pip install pytesseract
2、截屏識(shí)別文字
import pyautogui
import pytesseract
# 設(shè)置Tesseract的安裝路徑(如果它不在默認(rèn)的系統(tǒng)路徑中)
pytesseract.pytesseract.tesseract_cmd = 'D:/Program Files/Tesseract-OCR/tesseract.exe'
# 截取屏幕截圖
screenshot = pyautogui.screenshot()
# 定義區(qū)域范圍(左上角x坐標(biāo),左上角y坐標(biāo),右下角x坐標(biāo),右下角y坐標(biāo))
region = (100, 100, 300, 200)
# 從屏幕截圖中使用指定區(qū)域創(chuàng)建一個(gè)新的圖像對(duì)象
custom_screenshot = screenshot.crop(region)
# 將圖像對(duì)象轉(zhuǎn)換為灰度圖像,以幫助提高文本識(shí)別的準(zhǔn)確性
custom_screenshot = custom_screenshot.convert('L')
# 使用pytesseract進(jìn)行文字識(shí)別
text = pytesseract.image_to_string(custom_screenshot)
# 打印識(shí)別的文本
print(text)
3、準(zhǔn)確度
英文準(zhǔn)確度還行,中文準(zhǔn)確度。。。一言難盡。應(yīng)該是可以通過(guò)訓(xùn)練提高準(zhǔn)確度的。
參考資料
https://blog.csdn.net/weixin_51571728/article/details/120384909
到此這篇關(guān)于python+Tesseract OCR實(shí)現(xiàn)截屏識(shí)別文字的文章就介紹到這了,更多相關(guān)python Tesseract OCR 識(shí)別文字內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python實(shí)現(xiàn)的簡(jiǎn)單RPG游戲流程實(shí)例
這篇文章主要介紹了python實(shí)現(xiàn)的簡(jiǎn)單RPG游戲流程,實(shí)例分析了Python實(shí)現(xiàn)RPG游戲流程的常用判定技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-06-06
Python爬蟲(chóng)工具requests-html使用解析
這篇文章主要介紹了Python爬蟲(chóng)工具requests-html使用解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-04-04
Python調(diào)用C# Com dll組件實(shí)戰(zhàn)教程
下面小編就為大家?guī)?lái)一篇Python調(diào)用C# Com dll組件實(shí)戰(zhàn)教程。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-10-10
django model去掉unique_together報(bào)錯(cuò)的解決方案
本文給大家分享的是在使用django model去掉unique_together時(shí)報(bào)錯(cuò)的解決思路和具體步驟,提供給大家參考下,希望對(duì)大家學(xué)習(xí)使用django能夠有所幫助2016-10-10
Python報(bào)錯(cuò)TypeError: unsupported operand的問(wèn)題分析和解決方法
TypeError: unsupported operand 是Python中常見(jiàn)的一類錯(cuò)誤,通常在嘗試對(duì)不兼容的數(shù)據(jù)類型進(jìn)行操作時(shí)發(fā)生,比如,當(dāng)你嘗試對(duì)字符串和整數(shù)進(jìn)行加法操作時(shí),Python會(huì)拋出這一錯(cuò)誤,所以本文給大家介紹了Python報(bào)錯(cuò)TypeError: unsupported operand的問(wèn)題解決2024-09-09
Python判斷某個(gè)用戶對(duì)某個(gè)文件的權(quán)限
這篇文章主要為大家詳細(xì)介紹了Python如何判斷某個(gè)用戶對(duì)某個(gè)文件的權(quán)限,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2016-10-10
Pandas中map(),applymap(),apply()函數(shù)的使用方法
本文主要介紹了Pandas中map(),applymap(),apply()函數(shù)的使用方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02
python如何修改PYTHONPATH環(huán)境變量
這篇文章主要介紹了python如何修改PYTHONPATH環(huán)境變量問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08
PyCharm如何設(shè)置新建文件默認(rèn)為L(zhǎng)F換行符
這篇文章主要介紹了PyCharm如何設(shè)置新建文件默認(rèn)為L(zhǎng)F換行符問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2025-03-03

