Python調(diào)用百度AI實(shí)現(xiàn)圖片上表格識(shí)別功能

更新時(shí)間：2021年09月14日 11:52:46 作者：魚(yú)尾努力淦飯

這篇文章主要給大家介紹了關(guān)于Python調(diào)用百度AI實(shí)現(xiàn)圖片上表格識(shí)別功能的相關(guān)資料,在Python環(huán)境下,利用百度AI開(kāi)放平臺(tái)文字識(shí)別技術(shù),對(duì)表格類圖片進(jìn)行識(shí)別,需要的朋友可以參考下

簡(jiǎn)介

Python免費(fèi)調(diào)用百度AI實(shí)現(xiàn)圖片上面的表格識(shí)別

步驟

安裝百度AI庫(kù)

!pip install baidu-aip

注冊(cè)百度AI開(kāi)放平臺(tái)

先注冊(cè)百度AI，獲得ID和密鑰。注冊(cè)方法可參考：注冊(cè)方法只需走到 “1.6 獲取密鑰” 即可。然后記錄下自己的APP_ID、API_KEY、SECRET_KEY，就可以開(kāi)始了。

調(diào)用AipOcr庫(kù)識(shí)別表格文字

from aip import AipOcr #導(dǎo)入AipOcr模塊，用于做文字識(shí)別

APP_ID = '*********' # 你申請(qǐng)的
API_KEY = '*********'# 你申請(qǐng)的
SECRET_KEY = '*********'# 你申請(qǐng)的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

選擇的圖片為某化學(xué)方程式表（來(lái)源于網(wǎng)絡(luò)）

以二進(jìn)制方式打開(kāi)圖片，讀取：

file = "表格圖片\\化學(xué)方程式表.jpg"
pic = open(file,'rb') #以二進(jìn)制方式打開(kāi)圖片
img = pic.read() #讀取
table = client.tableRecognitionAsync(img)    #調(diào)用表格識(shí)別模塊
print(table)

然后調(diào)用表格識(shí)別模塊tableRecognitionAsync()，并將返回值存入變量table中并查看：

table是一個(gè)字典，其中有2個(gè)鍵，一個(gè)叫result，一個(gè)叫l(wèi)og_id。我們需要的是result中的request_id,可以通過(guò)如下語(yǔ)句獲取：

request_id = table['result'][0]['request_id']
request_id

通過(guò)這個(gè)ID，可以獲取識(shí)別完成后所保存的Excel表格的下載地址。將request_id傳入getTableRecognitionResult()就能獲取結(jié)果。

result = client.getTableRecognitionResult(request_id)
print(result)

打印一下結(jié)果result，就能看到下面的內(nèi)容。其中result_data對(duì)應(yīng)的那個(gè)網(wǎng)址就是Excel表格的下載地址。

調(diào)用webbrowser庫(kù)使用webbrowser.open(url)語(yǔ)句自動(dòng)打開(kāi)網(wǎng)址進(jìn)行下載：

url = result['result']['result_data']

import webbrowser # 打開(kāi)瀏覽器
webbrowser.open(url)

附：Python 通過(guò)瀏覽器打開(kāi)指定網(wǎng)址

1.通過(guò)默認(rèn)瀏覽器打開(kāi)網(wǎng)頁(yè)

import webbrowser
webbrowser.open("http://www.baidu.com")

　webbrowser.open(url, new=0, autoraise=True) 在系統(tǒng)的默認(rèn)瀏覽器中訪問(wèn)url地址，如果new=0, url會(huì)在同一個(gè)

瀏覽器窗口中打開(kāi)；如果new=1，新的瀏覽器窗口會(huì)被打開(kāi);new=2 新的瀏覽器tab會(huì)被打開(kāi)

2.通過(guò)os模塊,啟動(dòng)瀏覽器并打開(kāi)指定網(wǎng)頁(yè)

import os
os.system('"C:\Program Files\internet explorer\iexplore.exe" http://www.baidu.com')

3.使用selenium

from selenium import webdriver
url='http://www.baidu.com'
driver = webdriver.Firefox()
driver.get(url)

識(shí)別結(jié)果如下:

這個(gè)Excel文件有6張工作表，具體包含與圖片中表格內(nèi)容的對(duì)應(yīng)關(guān)系如下。body儲(chǔ)存表格部分的內(nèi)容，header儲(chǔ)存表頭的文字，footer儲(chǔ)存表尾的文字。

識(shí)別效果并非完美，但是整體看來(lái)還行，當(dāng)然，原稿越清晰，識(shí)別效果越好。

可能遇到的問(wèn)題

在開(kāi)始前，需要檢查圖片的大小，必須在1K~4M之間，不然會(huì)報(bào)錯(cuò)“‘error_msg': ‘image size error, image is too big or too small, upper limit 4M, lower limit 1k, please check your param'”。

批量操作

先獲取所有圖片的路徑，存入pictures列表。結(jié)果如下。

#獲取路徑下所有圖片文件，并存入列表
import os
work_path = "表格圖片\\"
pictures=[] # 存儲(chǔ)文件夾內(nèi)所有文件的路徑（包括子目錄內(nèi)的文件）
for root, dirs, files in os.walk(work_path):
    path = [os.path.join(root, name) for name in files]
    pictures.extend(path)
pictures

然后將所有圖片逐個(gè)傳入表格識(shí)別接口，獲取其請(qǐng)求ID及存有識(shí)別結(jié)果的Excel文件的下載地址。在提取Excel下載路徑之前，需要先判斷識(shí)別是否完成。這是通過(guò)識(shí)別結(jié)果返回的字典中的'ret_msg'對(duì)應(yīng)的值來(lái)判斷的。只有當(dāng)它是“已完成”時(shí)，才能獲得下載鏈接。此處用了while循環(huán)，每隔2秒刷新一下?tīng)顟B(tài)，直到狀態(tài)是“已完成”時(shí)，才提取鏈接。然后使用requests.get()獲取下載鏈接信息，寫(xiě)入Excel文件。Excel自動(dòng)命名及下載結(jié)果如圖。

from aip import AipOcr  #導(dǎo)入AipOcr模塊，用于做文字識(shí)別
import time #時(shí)間模塊
import requests #用于HTTP請(qǐng)求

APP_ID = '24800359' # 你申請(qǐng)的
API_KEY = 'PrmTtmrqkeaqhvxOPEN4eZVt'# 你申請(qǐng)的
SECRET_KEY = 'LOFpCH6wpLV7xZPG0DTcvV4x1Sqyvmk9'# 你申請(qǐng)的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

#提交識(shí)別請(qǐng)求，并儲(chǔ)存所有請(qǐng)求ID
for picture in pictures:
    pic = open(picture,'rb') #以二進(jìn)制方式打開(kāi)圖片
    img = pic.read() #讀取
    table = client.tableRecognitionAsync(img)    #調(diào)用表格識(shí)別模塊
    request_id = table['result'][0]['request_id']
    
    #判斷識(shí)別是否完成，直到完成才根據(jù)請(qǐng)求ID獲取Excel下載路徑
    result = client.getTableRecognitionResult(request_id)  #通過(guò)ID獲取識(shí)別結(jié)果
    while result['result']['ret_msg'] != '已完成': #如果狀態(tài)是“已完成”，才能獲取下載地址
        time.sleep(2) #暫停2秒再刷新
        result = client.getTableRecognitionResult(request_id) #持續(xù)刷新，直到滿足條件
        
    download_path = result['result']['result_data']
    
    #下載并將Excel文件名設(shè)為圖片名
    excel_name = picture.split(".")[0] + ".xls" #讓excel文件的名字與圖片相同
    excel = requests.get(download_path) #抓取下載鏈接
    file = open(excel_name, 'wb') #新建excel文件
    file.write(excel.content) #寫(xiě)入excel文件并保存

總結(jié)

到此這篇關(guān)于Python調(diào)用百度AI實(shí)現(xiàn)圖片上表格識(shí)別功能的文章就介紹到這了,更多相關(guān)Python調(diào)用百度AI識(shí)別表格內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: