python圖片驗證碼識別最新模塊muggle_ocr的示例代碼

更新時間：2020年07月03日 08:48:28 作者：小小咸魚YwY

這篇文章主要介紹了python圖片驗證碼識別最新模塊muggle_ocr的相關知識，本文通過實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下

一.官方文檔

二模塊安裝

pip install muggle-ocr
# 因模塊過新，阿里/清華等第三方源可能尚未更新鏡像，因此手動指定使用境外源，為了提高依賴的安裝速度，可預先自行安裝依賴：tensorflow/numpy/opencv-python/pillow/pyyaml

三.使用代碼

# 導入包
import muggle_ocr

# 初始化；model_type 包含了 ModelType.OCR/ModelType.Captcha 兩種
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)
# ModelType.OCR 可識別光學印刷文本 這里個人覺得應該是官方文檔寫錯了 官方文檔是ModelType.Captcha 可識別光學印刷文本
with open(r"test1.png", "rb") as f:
 b = f.read()
text = sdk.predict(image_bytes=b)
print(text)

# ModelType.Captcha 可識別4-6位驗證碼
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
with open(r"test1.png", "rb") as f:
 b = f.read()
text = sdk.predict(image_bytes=b)
print(text)

PS：下面看下 Python 實現(xiàn)全自動登錄(真正的全自動，自動識別驗證碼)

你沒有看錯，全自動驗證~~~

黑科技？還是黑代碼？
我感覺這個看在你用啥，對不對？反正我用來（* * * * ）你懂得

好了，先說一下用到的東西

selenium (本意是用來全自動測試)
Phantomjs (一種沒有界面的瀏覽器)
** 驗證碼識別器（一塊錢可用100次的這種）

關門放代碼

from selenium import webdriver
from PIL import Image
if __name__ == '__main__':
 wbe = webdriver.PhantomJS()
 wbe.get("https://www.某個網站的登錄頁面.com/login/index.html")//你可以拿知乎，百度，等等測試
 element = wbe.find_element_by_xpath('//*[@id="entry_name"]/p[3]/img')//驗證碼所在的xpath路徑
 left = element.location['x']
 top = element.location['y']
 right = element.location['x'] + element.size['width']
 bottom = element.location['y'] + element.size['height']
 im = Image.open(r'登錄頁.png')//全頁面截屏
 im = im.crop((left, top, right, bottom))
 im.save('驗證碼.png')

#!/usr/bin/env python
# coding:utf-8
import requests
from hashlib import md5
class RClient(object):
 def __init__(self, username, password, soft_id, soft_key):
  self.username = username
  self.password = md5(password).hexdigest()
  self.soft_id = soft_id
  self.soft_key = soft_key
  self.base_params = {
   'username': self.username,
   'password': self.password,
   'softid': self.soft_id,
   'softkey': self.soft_key,
  }
  self.headers = {
   'Connection': 'Keep-Alive',
   'Expect': '100-continue',
   'User-Agent': 'ben',
  }
 def rk_create(self, im, im_type, timeout=60):
  """
  im: 圖片字節(jié)
  im_type: 題目類型
  """
  params = {
   'typeid': im_type,
   'timeout': timeout,
  }
  params.update(self.base_params)
  files = {'image': ('a.png', im)}
  r = requests.post('http://api.ruokuai.com/create.json', data=params, files=files, headers=self.headers)
  return r.json()
 def rk_report_error(self, im_id):
  """
  im_id:報錯題目的ID
  """
  params = {
   'id': im_id,
  }
  params.update(self.base_params)
  r = requests.post('http://api.ruokuai.com/reporterror.json', data=params, headers=self.headers)
  return r.json()
def get_code():
 rc = RClient('用戶名', '密碼', '94522', '62c235939b7240879453f31603733fd6')//想拿下測試的留言我，教你拿到測試賬號
 im = open('a.png', 'rb').read()
 print rc.rk_create(im, 3040)

完整代碼

#!/usr/bin/env python
# coding:utf-8
from selenium import webdriver
from PIL import Image
import requests
from hashlib import md5
import time
class RClient(object):
 def __init__(self, username, password, soft_id, soft_key):
  self.username = username
  self.password = md5(password.encode("utf-8")).hexdigest()
  self.soft_id = soft_id
  self.soft_key = soft_key
  self.base_params = {
   'username': self.username,
   'password': self.password,
   'softid': self.soft_id,
   'softkey': self.soft_key,
  }
  self.headers = {
   'Connection': 'Keep-Alive',
   'Expect': '100-continue',
   'User-Agent': 'ben',
  }
 def rk_create(self, im, im_type, timeout=60):
  """
  im: 圖片字節(jié)
  im_type: 題目類型
  """
  params = {
   'typeid': im_type,
   'timeout': timeout,
  }
  params.update(self.base_params)
  files = {'image': ('a.png', im)}
  r = requests.post('http://api.ruokuai.com/create.json', data=params, files=files, headers=self.headers)
  return r.json()
 def rk_report_error(self, im_id):
  """
  im_id:報錯題目的ID
  """
  params = {
   'id': im_id,
  }
  params.update(self.base_params)
  r = requests.post('http://api.ruokuai.com/reporterror.json', data=params, headers=self.headers)
  return r.json()
def get_code(im_file):
 rc = RClient('賬號', '密碼', '94522', '62c235939b7240879453f31603733fd6')
 im_source = open(im_file, "rb").read()
 print(rc.rk_create(im_source, 3040))
if __name__ == '__main__':
 wbe = webdriver.PhantomJS()
 wbe.get("https://www.dajiang365.com/login/index.html")
 time.sleep(2)
 wbe.save_screenshot("das.png")
 element = wbe.find_element_by_xpath('//*[@id="entry_name"]/p[3]/img')
 left = element.location['x']
 top = element.location['y']
 right = element.location['x'] + element.size['width']
 bottom = element.location['y'] + element.size['height']
 im = Image.open(r'das.png')
 im = im.crop((left, top, right, bottom))
 im.save('a.png')
 time.sleep(2)
 get_code("a.png")

總結

到此這篇關于python圖片驗證碼識別最新模塊muggle_ocr的示例代碼的文章就介紹到這了,更多相關python 驗證碼識別模塊muggle_ocr內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Python實現(xiàn)模擬分割大文件及多線程處理的方法
這篇文章主要介紹了Python實現(xiàn)模擬分割大文件及多線程處理的方法,涉及Python文件讀取、分割及多線程相關操作技巧,需要的朋友可以參考下
2017-10-10
python實現(xiàn)最小二乘法線性擬合
這篇文章主要為大家詳細介紹了python實現(xiàn)最小二乘法線性擬合，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2019-07-07
一文詳解如何用GPU來運行Python代碼
前幾天搗鼓了一下Ubuntu，正是想用一下我舊電腦上的N卡，可以用GPU來跑代碼，體驗一下多核的快樂，感興趣的小伙伴快跟隨小編一起了解一下吧
2023-02-02
Python使用Excel將數(shù)據(jù)寫入多個sheet
這篇文章主要介紹了Python使用Excel將數(shù)據(jù)寫入多個sheet,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-05-05
Python數(shù)據(jù)可視化處理庫PyEcharts柱狀圖,餅圖,線性圖,詞云圖常用實例詳解
這篇文章主要介紹了Python數(shù)據(jù)可視化處理庫PyEcharts柱狀圖、餅圖、線性圖常用實例詳解,需要的朋友可以參考下
2020-02-02
python中print格式化輸出的問題
所謂格式化輸出，就是創(chuàng)建一個可以嵌入變量內容的字符串。這篇文章主要介紹了python中print格式化輸出,需要的朋友可以參考下
2021-04-04
python矩陣基本運算的實現(xiàn)
本文主要介紹了python?矩陣的基本運算，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-07-07
python 實現(xiàn)邏輯回歸
這篇文章主要介紹了python 實現(xiàn)邏輯回歸的方法，幫助大家更好的理解和使用python，感興趣的朋友可以了解下
2020-12-12
解決Pycharm出現(xiàn)的部分快捷鍵無效問題
今天小編就為大家分享一篇解決Pycharm出現(xiàn)的部分快捷鍵無效問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-10-10
Python字符串的拆分與連接詳解
由于字符串數(shù)據(jù)幾乎無處不在，因此掌握有關字符串的交易工具非常重要。幸運的是，Python 使字符串操作變得非常簡單，尤其是與其他語言甚至舊版本的 Python 相比時。本文將為大家詳細介紹Python中字符串的拆分與連接，需要的可以參考一下
2021-12-12