Python通用驗(yàn)證碼識(shí)別OCR庫ddddocr的安裝使用教程
前言
在使用自動(dòng)化登錄網(wǎng)站的時(shí)候,經(jīng)常輸入用戶名和密碼后會(huì)遇到驗(yàn)證碼。今天介紹一款通用驗(yàn)證碼識(shí)別 OCR庫,對驗(yàn)證碼識(shí)別徹底說拜拜,它的名字是 ddddocr(帶帶弟弟 OCR )。這里主要以字母數(shù)字類驗(yàn)證碼進(jìn)行說明。
項(xiàng)目地址:https://github.com/sml2h3/ddddocr
一、安裝ddddocr
通過命令將自動(dòng)安裝符合自己電腦環(huán)境的最新 ddddocr。
pip install ddddocr
如果安裝速度慢,可以連接國內(nèi)鏡像進(jìn)行安裝,命令如下:
pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple/
二、使用ddddocr
1. 使用舉例
import ddddocr
ocr = ddddocr.DdddOcr()
with open('code.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print('識(shí)別出的驗(yàn)證碼為:' + res)
2. 完整代碼
import os
import ddddocr
from time import sleep
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
class GetVerificationCode:
def __init__(self):
self.res = None
url = '要登錄的地址'
self.driver = webdriver.Chrome()
self.driver.maximize_window() # 將瀏覽器最大化
self.driver.get(url)
# 獲取驗(yàn)證碼信息
def getVerification(self):
# 獲取當(dāng)前文件的位置、并獲取保存截屏的位置
current_location = os.path.dirname(__file__)
screenshot_path = os.path.join(current_location, "..", "VerificationCode")
# 截取當(dāng)前網(wǎng)頁并放到自定義目錄下,并命名為printscreen,該截圖中有我們需要的驗(yàn)證碼
sleep(1)
self.driver.save_screenshot(screenshot_path + '//' + 'printscreen.png')
sleep(1)
# 定位驗(yàn)證碼
imgelement = self.driver.find_element(By.XPATH, '驗(yàn)證碼圖片的Xpath定位')
# 獲取驗(yàn)證碼x,y軸坐標(biāo)
location = imgelement.location
# 獲取驗(yàn)證碼的長寬
size = imgelement.size
# 寫成我們需要截取的位置坐標(biāo)
rangle = (int(location['x'] + 430),
int(location['y'] + 200),
int(location['x'] + size['width'] + 530),
int(location['y'] + size['height'] + 250))
# 打開截圖
i = Image.open(screenshot_path + '//' + 'printscreen.png')
# 使用Image的crop函數(shù),從截圖中再次截取我們需要的區(qū)域
fimg = i.crop(rangle)
fimg = fimg.convert('RGB')
# 保存我們截下來的驗(yàn)證碼圖片,并讀取驗(yàn)證碼內(nèi)容
fimg.save(screenshot_path + '//' + 'code.png')
ocr = ddddocr.DdddOcr()
with open(screenshot_path + '//' + 'code.png', 'rb') as f:
img_bytes = f.read()
self.res = ocr.classification(img_bytes)
print('識(shí)別出的驗(yàn)證碼為:' + self.res)
# 判斷驗(yàn)證碼錯(cuò)誤時(shí)的提示信息是否存在
def isElementPresent(self, by, value):
try:
element = self.driver.find_element(by=by, value=value)
except NoSuchElementException:
pass
# 發(fā)生了NoSuchElementException異常,說明頁面中未找到該元素,返回False
return False
else:
# 沒有發(fā)生異常,表示在頁面中找到了該元素,返回True
return True
# 登錄
def login(self):
self.getVerification()
self.driver.find_element(By.XPATH, '用戶名輸入框Xpath定位').send_keys('用戶名')
self.driver.find_element(By.XPATH, '密碼輸入框Xpath定位').send_keys('密碼')
self.driver.find_element(By.XPATH, '驗(yàn)證碼輸入框Xpath定位').send_keys(self.res)
sleep(1)
self.driver.find_element(By.XPATH, '登錄按鈕Xpath定位').click()
sleep(2)
isFlag = True
while isFlag:
try:
isPresent = self.isElementPresent(By.XPATH, '驗(yàn)證碼錯(cuò)誤時(shí)的提示信息Xpath定位')
if isPresent is True:
codeText = self.driver.find_element(By.XPATH, '驗(yàn)證碼錯(cuò)誤時(shí)的提示信息Xpath定位').text
if codeText == "驗(yàn)證碼不正確":
self.getVerification()
sleep(2)
self.driver.find_element(By.XPATH, '驗(yàn)證碼輸入框Xpath定位').clear()
sleep(1)
self.driver.find_element(By.XPATH, '驗(yàn)證碼輸入框Xpath定位').send_keys(self.res)
sleep(1)
self.driver.find_element(By.XPATH, '登錄按鈕Xpath定位').click()
sleep(2)
tips = self.driver.find_element(By.XPATH,
'未輸入驗(yàn)證碼時(shí)的提示信息Xpath定位').text
if tips == "請輸入驗(yàn)證碼":
self.getVerification()
sleep(2)
self.driver.find_element(By.XPATH, '驗(yàn)證碼輸入框Xpath定位').click()
sleep(1)
self.driver.find_element(By.XPATH, '驗(yàn)證碼輸入框Xpath定位').send_keys(self.res)
sleep(1)
self.driver.find_element(By.XPATH, '登錄按鈕Xpath定位').click()
sleep(2)
continue
else:
print("驗(yàn)證碼正確,登錄成功!")
except NoSuchElementException:
pass
else:
isFlag = False
sleep(5)
self.driver.quit()
if __name__ == '__main__':
GetVerificationCode().login()3. 驗(yàn)證碼樣例



4. 識(shí)別結(jié)果
可以實(shí)現(xiàn):驗(yàn)證碼識(shí)別錯(cuò)誤后,繼續(xù)識(shí)別

三、代碼說明
本文代碼中時(shí)間等待都是使用了強(qiáng)制等待,如有需要可對代碼進(jìn)行修改,可以使用顯示等待。關(guān)于selenium的三種等待方式(顯示等待,隱式等待,強(qiáng)制等待)可以參考其他博主的文章了解學(xué)習(xí)。
總結(jié)
對于現(xiàn)在已有的驗(yàn)證碼圖片都有可能具備一定的識(shí)別能力。簡單來說,ddddocr 讓驗(yàn)證碼識(shí)別變得如此簡單與易用,可以快速的檢測出圖片上的文字、數(shù)字或圖標(biāo),讓更多的伙伴能夠快速的破解網(wǎng)站的登錄驗(yàn)證碼。
到此這篇關(guān)于Python通用驗(yàn)證碼識(shí)別OCR庫ddddocr的安裝使用教程的文章就介紹到這了,更多相關(guān)Python驗(yàn)證碼識(shí)別OCR庫ddddocr內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python調(diào)用文字識(shí)別OCR輕松搞定驗(yàn)證碼
- 基于Python實(shí)現(xiàn)圖像文字識(shí)別OCR工具
- Python免費(fèi)驗(yàn)證碼識(shí)別之ddddocr識(shí)別OCR自動(dòng)庫實(shí)現(xiàn)
- Python通用驗(yàn)證碼識(shí)別OCR庫之ddddocr驗(yàn)證碼識(shí)別
- python?ocr簡單示例之識(shí)別驗(yàn)證碼
- python實(shí)戰(zhàn)教程之OCR文字識(shí)別方法匯總
- Python使用paddleOCR批量識(shí)別pdf的方法
- python使用ddddocr庫識(shí)別滑動(dòng)驗(yàn)證碼簡單代碼示例
- Python利用cnocr庫實(shí)現(xiàn)pdf文件的文字識(shí)別
- python利用ddddocr包ocr識(shí)別圖片碼的實(shí)現(xiàn)
相關(guān)文章
一篇文章教你用Python實(shí)現(xiàn)一個(gè)學(xué)生管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)學(xué)生管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09
python+Selenium自動(dòng)化測試——輸入,點(diǎn)擊操作
這篇文章主要介紹了python+Selenium自動(dòng)化測試——輸入,點(diǎn)擊操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-03-03
基于python和pygame庫實(shí)現(xiàn)刮刮樂游戲
這篇文章主要介紹了如何基于python和pygame庫實(shí)現(xiàn)刮刮樂游戲,文中通過代碼示例和圖文給大家講解的非常詳細(xì),對大家的學(xué)習(xí)或工作有一定的幫助,需要的朋友可以參考下2024-03-03
Python中sklearn實(shí)現(xiàn)交叉驗(yàn)證示例分析
這篇文章主要介紹了Python中sklearn實(shí)現(xiàn)交叉驗(yàn)證,本文python的版本為3.8,各個(gè)版本之間函數(shù)名字略有不同,但是原理都是一樣的,集成開發(fā)環(huán)境使用的是Anaconda的Spyder,需要的朋友可以參考下2023-08-08
BeautifulSoup中find和find_all的使用詳解
這篇文章主要介紹了BeautifulSoup中find和find_all的使用詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12
Pandas實(shí)現(xiàn)在線文件和剪貼板數(shù)據(jù)讀取詳解
這篇文章主要為大家介紹的是Pandas兩種少用的讀取文件方式:讀取在線文件的數(shù)據(jù)和讀取剪貼板的數(shù)據(jù),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-06-06
Python 數(shù)據(jù)分析之Beautiful Soup 提取頁面信息
Beautiful Soup 提供一些簡單的、python 式的函數(shù)用來處理導(dǎo)航、搜索、修改分析樹等功能。它是一個(gè)工具箱,通過解析文檔為用戶提供需要抓取的數(shù)據(jù),因?yàn)楹唵?,所以不需要多少代碼就可以寫出一個(gè)完整的應(yīng)用程序2021-10-10

