50行Python代碼實(shí)現(xiàn)人臉檢測(cè)功能
現(xiàn)在的人臉識(shí)別技術(shù)已經(jīng)得到了非常廣泛的應(yīng)用,支付領(lǐng)域、身份驗(yàn)證、美顏相機(jī)里都有它的應(yīng)用。用iPhone的同學(xué)們應(yīng)該對(duì)下面的功能比較熟悉
iPhone的照片中有一個(gè)“人物”的功能,能夠?qū)⒄掌锏娜四樧R(shí)別出來(lái)并分類,背后的原理也是人臉識(shí)別技術(shù)。
這篇文章主要介紹怎樣用Python實(shí)現(xiàn)人臉檢測(cè)。人臉檢測(cè)是人臉識(shí)別的基礎(chǔ)。人臉檢測(cè)的目的是識(shí)別出照片里的人臉并定位面部特征點(diǎn),人臉識(shí)別是在人臉檢測(cè)的基礎(chǔ)上進(jìn)一步告訴你這個(gè)人是誰(shuí)。
好了,介紹就到這里。接下來(lái),開始準(zhǔn)備我們的環(huán)境。
準(zhǔn)備工作
本文的人臉檢測(cè)基于dlib,dlib依賴Boost和cmake,所以首先需要安裝這些包,以Ubuntu為例:
$ sudo apt-get install build-essential cmake $ sudo apt-get install libgtk-3-dev $ sudo apt-get install libboost-all-dev
我們的程序中還用到numpy,opencv,所以也需要安裝這些庫(kù):
$ pip install numpy $ pip install scipy $ pip install opencv-python $ pip install dlib
人臉檢測(cè)基于事先訓(xùn)練好的模型數(shù)據(jù),從這里可以下到模型數(shù)據(jù)
http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
下載到本地路徑后解壓,記下解壓后的文件路徑,程序中會(huì)用到。
dlib的人臉特征點(diǎn)
上面下載的模型數(shù)據(jù)是用來(lái)估計(jì)人臉上68個(gè)特征點(diǎn)(x, y)的坐標(biāo)位置,這68個(gè)坐標(biāo)點(diǎn)的位置如下圖所示
我們的程序?qū)瑑蓚€(gè)步驟:
第一步,在照片中檢測(cè)人臉的區(qū)域
第二部,在檢測(cè)到的人臉區(qū)域中,進(jìn)一步檢測(cè)器官(眼睛、鼻子、嘴巴、下巴、眉毛)
人臉檢測(cè)代碼
我們先來(lái)定義幾個(gè)工具函數(shù):
def rect_to_bb(rect): x = rect.left() y = rect.top() w = rect.right() - x h = rect.bottom() - y return (x, y, w, h)
這個(gè)函數(shù)里的rect是dlib臉部區(qū)域檢測(cè)的輸出。這里將rect轉(zhuǎn)換成一個(gè)序列,序列的內(nèi)容是矩形區(qū)域的邊界信息。
def shape_to_np(shape, dtype="int"):
coords = np.zeros((68, 2), dtype=dtype)
for i in range(0, 68):
coords[i] = (shape.part(i).x, shape.part(i).y)
return coords
這個(gè)函數(shù)里的shape是dlib臉部特征檢測(cè)的輸出,一個(gè)shape里包含了前面說(shuō)到的臉部特征的68個(gè)點(diǎn)。這個(gè)函數(shù)將shape轉(zhuǎn)換成Numpy array,為方便后續(xù)處理。
def resize(image, width=1200): r = width * 1.0 / image.shape[1] dim = (width, int(image.shape[0] * r)) resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA) return resized
這個(gè)函數(shù)里的image就是我們要檢測(cè)的圖片。在人臉檢測(cè)程序的最后,我們會(huì)顯示檢測(cè)的結(jié)果圖片來(lái)驗(yàn)證,這里做resize是為了避免圖片過大,超出屏幕范圍。
接下來(lái),開始我們的主程序部分
import sys import numpy as np
import dlib import cv2
if len(sys.argv) < 2:
print "Usage: %s <image file>" % sys.argv[0]
sys.exit(1)
image_file = sys.argv[1]
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")
我們從sys.argv[1]參數(shù)中讀取要檢測(cè)人臉的圖片,接下來(lái)初始化人臉區(qū)域檢測(cè)的detector和人臉特征檢測(cè)的predictor。shape_predictor中的參數(shù)就是我們之前解壓后的文件的路徑。
image = cv2.imread(image_file) image = resize(image, width=1200) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) rects = detector(gray, 1)
在檢測(cè)特征區(qū)域前,我們先要檢測(cè)人臉區(qū)域。這段代碼調(diào)用opencv加載圖片,resize到合適的大小,轉(zhuǎn)成灰度圖,最后用detector檢測(cè)臉部區(qū)域。因?yàn)橐粡堈掌赡馨鄰埬?,所以這里得到的是一個(gè)包含多張臉的信息的數(shù)組rects。
for (i, rect) in enumerate(rects):
shape = predictor(gray, rect)
shape = shape_to_np(shape)
(x, y, w, h) = rect_to_bb(rect)
cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv2.putText(image, "Face #{}".format(i + 1), (x - 10, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
for (x, y) in shape:
cv2.circle(image, (x, y), 2, (0, 0, 255), -1)
cv2.imshow("Output", image)
cv2.waitKey(0)
對(duì)于每一張檢測(cè)到的臉,我們進(jìn)一步檢測(cè)臉部的特征(鼻子、眼睛、眉毛等)。對(duì)于臉部區(qū)域,我們用綠色的框在照片上標(biāo)出;對(duì)于臉部特征,我們用紅色的點(diǎn)標(biāo)出來(lái)。
最后我們把加了檢測(cè)標(biāo)識(shí)的照片顯示出來(lái),waitKey(0)表示按任意鍵可退出程序。
以上是我們程序的全部
測(cè)試
接下來(lái)是令人興奮的時(shí)刻,檢驗(yàn)我們結(jié)果的時(shí)刻到來(lái)了。
下面是原圖
下面是程序識(shí)別的結(jié)果
可以看到臉部區(qū)域被綠色的長(zhǎng)方形框起來(lái)了,臉上的特征(鼻子,眼睛等)被紅色點(diǎn)點(diǎn)標(biāo)識(shí)出來(lái)了。
總結(jié)
以上所述是小編給大家介紹的50行Python代碼實(shí)現(xiàn)人臉檢測(cè)功能,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
- python結(jié)合opencv實(shí)現(xiàn)人臉檢測(cè)與跟蹤
- Python+OpenCV人臉檢測(cè)原理及示例詳解
- python中使用OpenCV進(jìn)行人臉檢測(cè)的例子
- Python OpenCV利用筆記本攝像頭實(shí)現(xiàn)人臉檢測(cè)
- Python OpenCV調(diào)用攝像頭檢測(cè)人臉并截圖
- python 基于dlib庫(kù)的人臉檢測(cè)的實(shí)現(xiàn)
- Python基于OpenCV實(shí)現(xiàn)視頻的人臉檢測(cè)
- python opencv人臉檢測(cè)提取及保存方法
- python利用OpenCV2實(shí)現(xiàn)人臉檢測(cè)
- python實(shí)現(xiàn)人臉檢測(cè)的簡(jiǎn)單實(shí)例
相關(guān)文章
Python實(shí)現(xiàn)圖像隨機(jī)添加椒鹽噪聲和高斯噪聲
圖像噪聲是指存在于圖像數(shù)據(jù)中的不必要的或多余的干擾信息。在噪聲的概念中,通常采用信噪比(Signal-Noise?Rate,?SNR)衡量圖像噪聲。本文將利用Python實(shí)現(xiàn)對(duì)圖像隨機(jī)添加椒鹽噪聲和高斯噪聲,感興趣的可以了解一下2022-09-09
python使用rstrip函數(shù)刪除字符串末位字符
rstrip函數(shù)用于刪除字符串末位指定字符,默認(rèn)為空白符,這篇文章主要介紹了python使用rstrip函數(shù)刪除字符串末位字符的方法,需要的朋友可以參考下2023-04-04
全網(wǎng)最詳細(xì)的PyCharm+Anaconda的安裝過程圖解
這篇文章主要介紹了全網(wǎng)最詳細(xì)的PyCharm+Anaconda的安裝過程圖解,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-01-01
Python統(tǒng)計(jì)單詞出現(xiàn)的次數(shù)
最近經(jīng)理交給我一項(xiàng)任務(wù),統(tǒng)計(jì)一個(gè)文件中每個(gè)單詞出現(xiàn)的次數(shù),列出出現(xiàn)頻率最多的5個(gè)單詞。本文給大家?guī)?lái)了python 統(tǒng)計(jì)單詞次數(shù)的思路解析,需要的朋友參考下吧2018-04-04
5分鐘教會(huì)你用Docker部署一個(gè)Python應(yīng)用
Docker是一個(gè)開源項(xiàng)目,為開發(fā)人員和系統(tǒng)管理員提供了一個(gè)開放平臺(tái),可以將應(yīng)用程序構(gòu)建、打包為一個(gè)輕量級(jí)容器,并在任何地方運(yùn)行,下面這篇文章主要給大家介紹了關(guān)于如何通過5分鐘教會(huì)你用Docker部署一個(gè)Python應(yīng)用,需要的朋友可以參考下2022-06-06
Python使用socketServer包搭建簡(jiǎn)易服務(wù)器過程詳解
這篇文章主要介紹了Python使用socketServer包搭建簡(jiǎn)易服務(wù)器過程詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06
python3 unicode列表轉(zhuǎn)換為中文的實(shí)例
今天小編就為大家分享一篇python3 unicode列表轉(zhuǎn)換為中文的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2018-10-10
使用Flask-Login模塊實(shí)現(xiàn)用戶身份驗(yàn)證和安全性
當(dāng)你想要在你的Flask應(yīng)用中實(shí)現(xiàn)用戶身份驗(yàn)證和安全性時(shí),F(xiàn)lask-Login這個(gè)擴(kuò)展將會(huì)是你的最佳伙伴,它提供了一組簡(jiǎn)單而強(qiáng)大的工具來(lái)處理,下面我們就來(lái)看看具體的操作方法吧2023-08-08

