OpenCV(python)版實現(xiàn)文本分割之水平投影法
對于如下一張圖片,如何將文本區(qū)域分割成一行一行的了?

在文本分割領(lǐng)域中有一種很優(yōu)秀的算法:投影法,包括水平投影法和垂直投影法。本文主要講述水平投影法,水平投影法可以理解為一束光線從圖像的左側(cè)向右邊進行照射,每一條光線可以理解為圖像的一行,計算每一行上圖像的黑色像素點,從而可以對圖像進行分割。
import numpy as np
import cv2
def get_vvList(list_data):
#取出list中像素存在的區(qū)間
vv_list=list()
v_list=list()
for index,i in enumerate(list_data):
if i>0:
v_list.append(index)
else:
if v_list:
vv_list.append(v_list)
#list的clear與[]有區(qū)別
v_list=[]
return vv_list
if __name__=='__main__':
img_bgr=cv2.imread('./testImg/1.png',1)
if not img_bgr is None:
img=img_bgr.copy()
img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
#二值化
t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
'''
水平投影從左向右投射,計算每一行的黑色像素總數(shù)
'''
rows,cols=binary.shape
hor_list=[0]*rows
for i in range(rows):
for j in range(cols):
#統(tǒng)計每一行的黑色像素總數(shù)
if binary.item(i,j)==0:
hor_list[i]=hor_list[i]+1
'''
對hor_list中的元素進行篩選,可以去除一些噪點
'''
hor_arr=np.array(hor_list)
hor_arr[np.where(hor_arr<5)]=0
hor_list=hor_arr.tolist()
#繪制水平投影
img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
for i in range(rows):
pt1=(cols-1,i)
pt2=(cols-1-hor_list[i],i)
cv2.line(img_white,pt1,pt2,(0,),1)
cv2.imshow('水平投影',img_white)
cv2.waitKey(0)
#取出各個文字區(qū)間
vv_list=get_vvList(hor_list)
for i in vv_list:
img_hor=img_bgr[i[0]:i[-1],:,:]
cv2.imshow('文本行',img_hor)
cv2.waitKey(0)
運行上述代碼,可以看到水平投影的效果。

根據(jù)投影法的特征,可以很容易就將上述文本分割成文本行,如下圖所示:

到此這篇關(guān)于OpenCV(python)版實現(xiàn)文本分割之水平投影法的文章就介紹到這了,更多相關(guān)OpenCV水平投影 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python elasticsearch從創(chuàng)建索引到寫入數(shù)據(jù)的全過程
這篇文章主要介紹了python elasticsearch從創(chuàng)建索引到寫入數(shù)據(jù)的方法,本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2019-08-08
python3通過gevent.pool限制協(xié)程并發(fā)數(shù)量的實現(xiàn)方法
這篇文章主要介紹了python3通過gevent.pool限制協(xié)程并發(fā)數(shù)量的實現(xiàn)方法,本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-09-09
基于MTCNN/TensorFlow實現(xiàn)人臉檢測
這篇文章主要為大家詳細介紹了基于MTCNN/TensorFlow實現(xiàn)人臉檢測,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-05-05
使用Python實現(xiàn)查找PDF中的指定文本并高亮顯示
在處理大量PDF文檔時,有時我們需要快速找到特定的文本信息,本文將提供三個Python示例來幫助你在PDF文件中快速查找并高亮指定的文本,希望對大家有所幫助2024-03-03
Python qqbot 實現(xiàn)qq機器人的示例代碼
這篇文章主要介紹了Python qqbot 實現(xiàn)qq機器人的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07

