谷歌近日發布了一款專為移動GPU推理量身定制的輕量級人臉檢測器——亞毫秒級的人臉檢測算法Blaze Face。它能夠在旗艦設備上以200-1000+fps的速度運行,并且可以應用在諸多需要快速準確的識別出人臉區域的任務中,例如:2D/3D面部關鍵點識別與幾何評估、面部特征和表情分類以及面部區域分割等。
當提及“人臉識別技術”的時候,想必大家都不會覺得陌生。“人臉識別技術”自從二十世紀六十年代后期研發,再到九十世紀逐步進入市場,技術的準確率逐步達到了99%的高精準度,有的人臉識別軟件在國際標準的LFW數據庫中甚至取得了99.15%的準確率,已然反超了人眼的辨認能力。也正因此,各行各業都將人臉識別納入到了未來的規劃前景中,尤其是AI領域的企業,例如曠視科技,依圖科技,極鏈科技等公司,紛紛對此躍躍欲試。
在人臉識別技術發展初期,一個典型的基于視頻圖像的人臉識別系統一般都是自動檢測人臉區域,從視頻中提取特征,最后如果人臉存在則識別出人臉的身份。在視頻監控、信息安全和出入控制等應用中,基于視頻的人臉識別是一個非常重要的問題,也是目前人臉識別的一個熱點和難點。基于視頻比基于靜態圖像更具優越性,因為Bruce和Knight等人已證明,當人臉被求反或倒轉時,運動信息有助于人臉的識別。雖然視頻人臉識別是基于靜態圖像的人臉識別的直接擴展,但一般認為視頻人臉識別算法需要同時用到空間和時間信息,這類方法直到近幾年才開始受到重視并需要進一步的研究和發展。
目前視頻人臉識別還有很多的困難與挑戰,具體來說一是視頻圖像質量比較差:視頻圖像一般是在戶外(或室內,但是采集條件比較差)獲取的,通常沒有用戶的配合,所以視頻人臉圖像經常會有很大的光照和姿態變化,還可能會有遮擋和偽裝。
二是人臉圖像比較小:同樣,由于采集條件比較差,視頻人臉圖像一般會比基于靜態圖像的人臉識別系統的預設尺寸小。小尺寸的圖像不但會影響識別算法的性能,而且還會影響人臉檢測,分割和關鍵點定位的精度,這必然會導致整個人臉識別系統性能的下降。
在這種情況下,提升系統識別的精度與準確度顯然成為了人臉識別領域的當務之急。如何利用AI有效的推動人臉識別的發展,成為了人工智能視覺與圖像領域中的重點應用。
比如視頻AI領域的獨角獸極鏈科技,便提出了以四模塊來對場景中的人臉進行識別:
模塊一:視頻結構化,將視頻用鏡頭分割
在這一環節中,通常采用全局特征和局部特征相結合的方法。全局特征檢測全局顏色的分布突變,然后借用局部特征獲得的人臉識別的跟蹤結果、跟蹤軌跡的斷續來判斷視頻是否具有鏡頭切換。跟蹤來判斷鏡頭切換有一個很大的優點,因為后續的步驟也會采用相似的算法,所以這一步驟所需的算法是可以重復使用的。
模塊二:人臉軌跡提取
完成了鏡頭分割以后,就可以分割好的單一鏡頭里進行人臉軌跡提取。在軌跡提取的算法上,同樣要考慮準確率和速度的指標。要實現速度和準確率的平衡,可以有以下兩種途徑:一是間隔采樣or逐幀處理,二是檢測&跟蹤的配合。
模塊三:人臉識別
有了人臉軌跡之后,就可以開始進行人臉的識別了。但是在將人臉數據輸入深度網絡之前,還需要對其進行必要的變換和處理。其中一部分變換在針對人臉這一部分非常重要,尤其是在消費級視頻里,那就是人臉的對齊。人臉對齊是利用人臉的特征點檢測定位,將各種姿勢的人臉圖像還原矯正為正臉的過程。在算法框架中,需要加入人臉質量評估的算法,以過濾低質量的人臉圖片,保證人臉數據的準確率。
在樣本足夠的前提下,可以利用訓練得到的模型對人臉樣本進行特征提取。測試的時候,在視頻中檢測得的人臉后,將其輸入到生成的特征向量里,與人臉互動的特征向量進行匹配,從而找到在特征空間中最接近的一個樣本。
模塊四:識別結果融合
以上提到的人臉識別都是針對單幀識別的圖片而言的,之前說到的系統識別結果都是針對整個人臉軌跡而言。因此,最后需要將人臉識別的結果與整條人臉軌跡融合起來,得到整個軌跡的識別結果。
識別結果的融合策略也有很多。簡單的有投票策略,即將尾幀的識別結果是為一票,識別結果票數最高者則為軌跡的最終識別結果。也有用神經網絡來實現這一融合,可以訓練一個時間維度上的神經,將每一幀識別出的特征向量作為網絡的輸入,經過在時間維度上的一系列的參數變換得到最終的特征向量。
如果說AI是時代的浪潮,那人臉識別就是乘風破浪的小舟。在這個“刷臉”從調侃變為現實的今天,借著人工智能的發展,人臉識別可以擁有更高的精度,更強的識別,以及一個更寬廣的未來。
-
AI
+關注
關注
87文章
33973瀏覽量
274874 -
人臉識別技
+關注
關注
0文章
12瀏覽量
5891 -
人臉識別技術
+關注
關注
0文章
127瀏覽量
14691
發布評論請先 登錄

評論