50行Python代碼實(shí)現(xiàn)人臉檢測(cè)功能

更新時(shí)間：2018年01月23日 10:00:56 作者：強(qiáng)哥

現(xiàn)在的人臉識(shí)別技術(shù)已經(jīng)得到了非常廣泛的應(yīng)用，支付領(lǐng)域、身份驗(yàn)證、美顏相機(jī)里都有它的應(yīng)用。下面小編給大家?guī)?lái)了基于50行Python代碼實(shí)現(xiàn)人臉檢測(cè)功能，一起看看吧

現(xiàn)在的人臉識(shí)別技術(shù)已經(jīng)得到了非常廣泛的應(yīng)用，支付領(lǐng)域、身份驗(yàn)證、美顏相機(jī)里都有它的應(yīng)用。用iPhone的同學(xué)們應(yīng)該對(duì)下面的功能比較熟悉

iPhone的照片中有一個(gè)“人物”的功能，能夠?qū)⒄掌锏娜四樧R(shí)別出來(lái)并分類，背后的原理也是人臉識(shí)別技術(shù)。

這篇文章主要介紹怎樣用Python實(shí)現(xiàn)人臉檢測(cè)。人臉檢測(cè)是人臉識(shí)別的基礎(chǔ)。人臉檢測(cè)的目的是識(shí)別出照片里的人臉并定位面部特征點(diǎn)，人臉識(shí)別是在人臉檢測(cè)的基礎(chǔ)上進(jìn)一步告訴你這個(gè)人是誰(shuí)。

好了，介紹就到這里。接下來(lái)，開始準(zhǔn)備我們的環(huán)境。

準(zhǔn)備工作

本文的人臉檢測(cè)基于dlib，dlib依賴Boost和cmake，所以首先需要安裝這些包，以Ubuntu為例：

$ sudo apt-get install build-essential cmake 
$ sudo apt-get install libgtk-3-dev 
$ sudo apt-get install libboost-all-dev

我們的程序中還用到numpy，opencv，所以也需要安裝這些庫(kù)：

$ pip install numpy 
$ pip install scipy 
$ pip install opencv-python 
$ pip install dlib

人臉檢測(cè)基于事先訓(xùn)練好的模型數(shù)據(jù)，從這里可以下到模型數(shù)據(jù)

http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2

下載到本地路徑后解壓，記下解壓后的文件路徑，程序中會(huì)用到。

dlib的人臉特征點(diǎn)

上面下載的模型數(shù)據(jù)是用來(lái)估計(jì)人臉上68個(gè)特征點(diǎn)(x, y)的坐標(biāo)位置，這68個(gè)坐標(biāo)點(diǎn)的位置如下圖所示

我們的程序?qū)瑑蓚€(gè)步驟：

第一步，在照片中檢測(cè)人臉的區(qū)域

第二部，在檢測(cè)到的人臉區(qū)域中，進(jìn)一步檢測(cè)器官（眼睛、鼻子、嘴巴、下巴、眉毛）

人臉檢測(cè)代碼

我們先來(lái)定義幾個(gè)工具函數(shù)：

def rect_to_bb(rect): 
  x = rect.left() 
  y = rect.top() 
  w = rect.right() - x 
  h = rect.bottom() - y   
  return (x, y, w, h)

這個(gè)函數(shù)里的rect是dlib臉部區(qū)域檢測(cè)的輸出。這里將rect轉(zhuǎn)換成一個(gè)序列，序列的內(nèi)容是矩形區(qū)域的邊界信息。

def shape_to_np(shape, dtype="int"): 
  coords = np.zeros((68, 2), dtype=dtype)   
  for i in range(0, 68): 
      coords[i] = (shape.part(i).x, shape.part(i).y)   
  return coords

這個(gè)函數(shù)里的shape是dlib臉部特征檢測(cè)的輸出，一個(gè)shape里包含了前面說(shuō)到的臉部特征的68個(gè)點(diǎn)。這個(gè)函數(shù)將shape轉(zhuǎn)換成Numpy array，為方便后續(xù)處理。

def resize(image, width=1200): 
  r = width * 1.0 / image.shape[1] 
  dim = (width, int(image.shape[0] * r)) 
  resized = cv2.resize(image, dim, interpolation=cv2.INTER_AREA)   
  return resized

這個(gè)函數(shù)里的image就是我們要檢測(cè)的圖片。在人臉檢測(cè)程序的最后，我們會(huì)顯示檢測(cè)的結(jié)果圖片來(lái)驗(yàn)證，這里做resize是為了避免圖片過大，超出屏幕范圍。

接下來(lái)，開始我們的主程序部分

import sys import numpy as np 
import dlib import cv2 
if len(sys.argv) < 2:   
  print "Usage: %s <image file>" % sys.argv[0] 
  sys.exit(1) 
image_file = sys.argv[1] 
detector = dlib.get_frontal_face_detector() 
predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")

我們從sys.argv[1]參數(shù)中讀取要檢測(cè)人臉的圖片，接下來(lái)初始化人臉區(qū)域檢測(cè)的detector和人臉特征檢測(cè)的predictor。shape_predictor中的參數(shù)就是我們之前解壓后的文件的路徑。

image = cv2.imread(image_file) 
image = resize(image, width=1200) 
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 
rects = detector(gray, 1)

在檢測(cè)特征區(qū)域前，我們先要檢測(cè)人臉區(qū)域。這段代碼調(diào)用opencv加載圖片，resize到合適的大小，轉(zhuǎn)成灰度圖，最后用detector檢測(cè)臉部區(qū)域。因?yàn)橐粡堈掌赡馨鄰埬?，所以這里得到的是一個(gè)包含多張臉的信息的數(shù)組rects。

for (i, rect) in enumerate(rects): 
  shape = predictor(gray, rect) 
  shape = shape_to_np(shape) 
  (x, y, w, h) = rect_to_bb(rect) 
  cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2) 
  cv2.putText(image, "Face #{}".format(i + 1), (x - 10, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)   
for (x, y) in shape: 
      cv2.circle(image, (x, y), 2, (0, 0, 255), -1) 
cv2.imshow("Output", image) 
cv2.waitKey(0)

對(duì)于每一張檢測(cè)到的臉，我們進(jìn)一步檢測(cè)臉部的特征（鼻子、眼睛、眉毛等）。對(duì)于臉部區(qū)域，我們用綠色的框在照片上標(biāo)出；對(duì)于臉部特征，我們用紅色的點(diǎn)標(biāo)出來(lái)。

最后我們把加了檢測(cè)標(biāo)識(shí)的照片顯示出來(lái)，waitKey(0)表示按任意鍵可退出程序。

以上是我們程序的全部

測(cè)試

接下來(lái)是令人興奮的時(shí)刻，檢驗(yàn)我們結(jié)果的時(shí)刻到來(lái)了。

下面是原圖