這兩年人工智能的火熱,已經(jīng)從概念進入到落地的階段,尤其是語音的人工智能音箱和機器視覺人臉識別的相關(guān)產(chǎn)品。早在人工智能技術(shù)興起之前,其實業(yè)內(nèi)對人臉識別技術(shù)就研發(fā)了很久,早期的技術(shù)是通過普通的攝像頭,抓取圖像和視頻上傳到到服務(wù)器,所有的識別工作由前端電腦或者服務(wù)器完成,但這樣服務(wù)器的壓力是巨大大,這種技術(shù)在越來越多應(yīng)用場景下,效率相對較低,甚至是不合理的, 大面積推廣也收到一定的限制。由于智能攝像頭技術(shù)的成熟,攝像頭前端具備音視頻解碼、傳輸功能之外,也集成了一些具有智能算法能力的硬件,能夠識別并抓取到人臉圖像,甚至通過算法提取完整的人臉特征數(shù)據(jù)(而不是圖片),然后上傳到服務(wù)器供后端處理,這樣服務(wù)器的壓力大大減小,識別的效率也就大大提升。
人臉識別系統(tǒng)的應(yīng)用普及,尤其在機場、高鐵站、銀行等系統(tǒng)的人臉驗證,大部分的老百姓,甚至一些行業(yè)從業(yè)人員,以為現(xiàn)在的人臉識別技術(shù)無所不能,其實應(yīng)用的局限性還是很大,上個月因為工作原因,比較頻繁接觸了這行的兄弟,有些認知和想法給大家分享一下。
一、人臉識別技術(shù)基本現(xiàn)狀
人臉識別技術(shù)其實早在人工智能概念之前,業(yè)內(nèi)就研發(fā)了很久,早期的技術(shù)是通過普通的攝像頭,抓取圖像和視頻上傳到到服務(wù)器,所有的識別工作由前端電腦或者服務(wù)器完成,但這樣服務(wù)器的壓力是巨大大,這種技術(shù)在越來越多應(yīng)用場景下,效率相對較低,甚至是不合理的。 因此人臉識別在前端攝像頭除了具備視頻傳輸錄像功能之外,也植入了一定的智能算法,能夠識別并抓取到人臉圖像,并且通過算法提取完整的人臉特征數(shù)據(jù)(而不是圖片),然后上傳到服務(wù)器供后端處理,這樣無論是服務(wù)器的壓力還是識別的效率都會大大提升。目前人臉識別技術(shù)主要是如下幾種情況。
1:1的比對識別
1:1比對主要是使用在身份驗證上,減少人工審核,人、證合一的問題。攝像頭抓到的頭像與身份證中預(yù)存的頭像信息進行確認,是否為同一個人。 主要場景就是機場、酒店、銀行等場所,這類應(yīng)用對準確率要求高,但技術(shù)的難度其實比較低,因為被驗證的人都是強配合的,有充分的拍照條件,能夠提供正面高清人臉圖片,通過身份證號碼從公安系統(tǒng)內(nèi)部調(diào)取到人臉特征數(shù)據(jù),這兩部分數(shù)據(jù)進行一對一比對,只要達到一個重合率就通過。
產(chǎn)品的難點是能夠獲得公安部的數(shù)據(jù)授權(quán), 目前只用公安部二所旗下的中盾公司具有獨家資質(zhì),他們提供一個身份證和人臉數(shù)據(jù)讀寫模塊,模塊直接可以對接到公安部數(shù)據(jù)庫, 模塊的售價800~900元,絕大部分利潤在這里被吃掉了。
1:N的人臉識別
這個這比較容易理解,就是從一堆的預(yù)存的人臉中,識別是對應(yīng)的身份出來。最典型的就是門禁、考勤類的應(yīng)用,首先要預(yù)登記每個人的人臉,攝像頭抓取的圖片與登記的一堆人臉進行逐個比對,判斷出是哪個人。這個比對可以放在本地的服務(wù)器(通常叫識別網(wǎng)關(guān)),也可以放在云端進行比對,由于云服務(wù)器和萬物互聯(lián)的概念,所有公司一定會把人臉也保存在云端。這類系統(tǒng)比較重要的指標(biāo)就是這個N的值(人臉數(shù)據(jù)量)。在100張人臉識別出每個人,和1萬張,甚至百萬張人臉去識別一個人,難度上有本質(zhì)的區(qū)別。
1:∞ 無窮的識別
這個其實與1:N類似,只是這個N數(shù)量巨大,通常是公安部的數(shù)據(jù)庫,通過拍照,或者人經(jīng)過攝像頭, 系統(tǒng)可以快速提取到這個人的身份信息。這個這種應(yīng)用場景相對較少,技術(shù)難點也是最高的,即使人臉照片很清晰的情況下,也很難識別準確。通常用來測試系統(tǒng)。 通過攝像頭拍照,上傳圖片或者人臉特征數(shù)據(jù), 與通過公安部門的數(shù)據(jù)庫比對,告知這個人是誰,相當(dāng)于要在10幾億的人群中找出相同的人臉,這個并不容易,而且特征相似的人臉其實還是蠻多的,能夠做按照相似度排列返回一個人員清單。我看到比較牛逼的就是深圳的警察手機APP很多都裝了這個應(yīng)用,通過拍照,然后自動識別出這個人是誰,身份證號碼多少等等個人信息。
二、人臉識別的準確率
現(xiàn)在很多人臉識別算法或者產(chǎn)品都有一個重要的的指標(biāo),就是識別準確率有多高。其實單純地講這個準確率其實是沒有意義的。
首先是這個準確率是要有前提的,攝像頭的圖像抓取質(zhì)量高度相關(guān),高清的正臉圖片識別率肯定很高, 但如果在光線不夠好,角度不是完全正面的情況下呢,這個準確率肯定是大打折扣的。
其次準確率的說法也是不嚴謹?shù)摹T谌四樧R別的時候,主要是對人臉特征數(shù)據(jù)重合率的比較,重合率達到一個閾值(例如80%),就算驗證通過,這就可以通過調(diào)節(jié)這個重合率的閾值來提高準確率。 例如門禁系統(tǒng),把重合率閾值設(shè)置比較低,就很容易驗證通過,這樣也很容易給人準確率很高的印象。但同時帶來的問題就是,很多相似的臉會被錯誤認為驗證通過。 如果調(diào)高重合率閾值,可以拒絕掉很多相似的臉,但同時本人的真臉也容易被拒絕,這個時候容易給人準確率低的印象。
這就是我們驗真率和拒假率,這個指標(biāo)有點類似指紋。這兩個指標(biāo)也基本上是矛和盾的關(guān)系。但如果一個好的算法,就會在這個點上達到一個平衡出一個最好的結(jié)果,同時在評估性能的時候,也是應(yīng)該同時參照這二個指標(biāo)的。
三、人工智能技術(shù)的應(yīng)用
目前具有人臉?biāo)惴ǖ墓静簧伲?除了一些開放平臺之外,提供標(biāo)準算法SDK,也有很多公司自己的算法,盡管算法原理大同小異,但各家還是自己一套封閉大系統(tǒng),相互并不兼容。這些算法很多得益于老美們將很多人臉數(shù)據(jù)庫的特征值和算法公開后,大大降低了研發(fā)的難度。
但總體感覺上,當(dāng)前大多數(shù)的人臉?biāo)惴ㄖ荒苁且粋€智能系統(tǒng),而不是人工智能系統(tǒng),所謂的人工智能,是指能夠模擬人的思維過程,通過神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)技術(shù)去逐漸學(xué)習(xí),逐漸提升人臉識別的準確性。 這有點類似人的思維,當(dāng)你多次使用了這個人臉識別系統(tǒng)后,你的數(shù)據(jù)越來越多,系統(tǒng)對你越來越熟悉,從而逐漸提高識別準確率。
機器學(xué)習(xí)最核心的是數(shù)據(jù),未來這些算法公司,可能最核心的不是算法有多牛,而是你擁有多少數(shù)據(jù),這個主要體現(xiàn)在二個方面,第一就是人臉數(shù)據(jù)庫的量,就是擁有多少人的人臉數(shù)據(jù),另外就是就是人臉驗證的使用數(shù)據(jù),當(dāng)你的系統(tǒng)被使用越多,各種狀態(tài),各種光線的情況下使用,人工智能系統(tǒng)的算法對你越熟悉,識別將會越來越準確。
目前公安部有全國最大的人臉數(shù)據(jù)庫,主要是頭像圖片,但數(shù)據(jù)庫沒有開放,必須要有甲級保密資質(zhì),一般公司沒有,針對人證驗證目前只用公安部二所旗下的中盾公司獨家資質(zhì)。對于非公安體系的民間公司來說,各家的算法公司收集人臉數(shù)據(jù)庫, 除公安外的政府部門的工商,交通等也都在收集人臉,現(xiàn)在去銀行,政府辦個什么事情,都是要微信小程序預(yù)約,并且上傳自己的人臉數(shù)據(jù),騰訊,滴滴,阿里等也都在通過各種方式積累人臉數(shù)據(jù)量,例如通過手機中照片抓取人臉,你發(fā)布在QQ空間,朋友圈的自拍招聘都會被這些公司收集人臉數(shù)據(jù)庫。
四、開放硬件平臺的設(shè)想
當(dāng)人臉識別進入到了人工智能階段,又會進入到互聯(lián)網(wǎng)公司的標(biāo)準規(guī)則,就是強者逾強。無論是機器學(xué)習(xí)的人工智能平臺,還是大數(shù)據(jù)的運營,也會變成幾家公司獨大,第二梯隊的公司難以維系。首先通過技術(shù)形成了門檻,然后引入資金,形成資金壁壘,通過資金形成了市場壁壘,然后閉環(huán)回到繼續(xù)加強了技術(shù)壁壘,造成強者恒強的局面。
剛才上文提到,人臉識別系統(tǒng)不是一個簡單互聯(lián)網(wǎng)系統(tǒng), 而是一個軟硬件高度結(jié)合的系統(tǒng),既要后端服務(wù)器的算法和神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)能力,同時要需要前端攝像頭硬件集成高度配合。這就我對硬件標(biāo)準平臺的攝像。
既然是開放的硬件平臺,首先要滿足的二個條件:
1.極大降低系統(tǒng)開發(fā)的難度,提供了標(biāo)準的硬件和服務(wù)器數(shù)據(jù)平臺的接口。
2.盡量是一個公立平臺, 只提供標(biāo)準配件,不涉及到一些具體的行業(yè)應(yīng)用。
3.有機會成為標(biāo)準配件,能夠快速撲向市場,收集用戶和數(shù)據(jù)。
1.標(biāo)準人臉攝像頭的配件
●內(nèi)置人臉抓取和特征數(shù)據(jù)提取上傳。
● 攝像頭接入網(wǎng)絡(luò)后,會自動在平臺注冊,注冊內(nèi)容有UUID,Product-Key等信息。●后臺操作,將注冊用戶與注冊的攝像頭進行關(guān)系綁定。
●內(nèi)置門禁接口,直接輸出標(biāo)準門禁控制信號。
● 從人臉識別到發(fā)出開門指令應(yīng)該要小于1秒。
2.服務(wù)器標(biāo)準接口
管理后臺和用戶客戶端為第三方合作伙伴提供標(biāo)準API接口,例如:
●通過輸入攝像頭系列號以及時間段,能夠返回攝像頭的人臉識別記錄’
●通過輸入人員用戶名、手機號等參數(shù)能夠返回人員經(jīng)過那些攝像頭編號及經(jīng)過時間的記錄。
●通過手機登陸注冊,或者微信小程序,將個人信息和照片上傳到服務(wù)器,生成人臉特征數(shù)據(jù)庫。
●用戶注冊人臉后,管理員可以通過后臺,將注冊人員與所屬攝像頭綁定。
●當(dāng)用戶經(jīng)過綁定攝像頭的時候會產(chǎn)生相應(yīng)的控制數(shù)據(jù)。
當(dāng)然這些接口只是拋磚引玉,需要根據(jù)不同的行業(yè)屬性完善相應(yīng)的接口。
五、門禁行業(yè)的應(yīng)用
上述的開放硬件接口將大大降低人臉識別行業(yè)的開放難度,一些傳統(tǒng)的軟硬件公司在這樣的開放硬件平臺上,能夠很快完成自己的系統(tǒng)。
目前的人臉識別攝像頭應(yīng)用逐漸普及,主要分為二大類,一類是與公安部門系統(tǒng)對接,例維穩(wěn)安保體系的人臉和身份證的驗證,疑犯追逃等,另一類企業(yè)內(nèi)部的獨立系統(tǒng),例如考勤、門禁等等。人臉識別前期最大的應(yīng)用領(lǐng)域都是與政府部門高度相關(guān),但這塊的市場門檻很高,這個門檻可能并不是技術(shù),而是一些大家都懂的原因。因此大量的公司都擁擠在民用領(lǐng)域,尤其是門禁的領(lǐng)域。這幾年來,車輛進出的車牌識別徹底取代了IC卡,尤其在深圳幾乎已經(jīng)很難看到刷卡停車的地方了,在一些三四線城市,也基本上被車牌識別攝像頭取代。 隨著人臉識別技術(shù)的成熟,我相信禁人臉的身份識別也將會徹底取代門卡。畢竟現(xiàn)在連錢包和銀行卡都懶得帶的,更何況門禁卡,用手機APP去開門又太麻煩,而且有些老年人也不會用,因此人臉識別門禁將是一個強烈的剛需了。
現(xiàn)有舊小區(qū),無論是小區(qū)大門還是單元門,都有很強烈的改造意向,但改造現(xiàn)有的門禁對講系統(tǒng)的成本又不能太高,如果只需要在門口頭頂安裝一個人臉識別的攝像頭,攝像頭輸出信號控制電鎖。業(yè)主經(jīng)過的時候,在1~2秒鐘,攝像頭識別人臉與數(shù)據(jù)庫比對成功后,輸出開門信號,這將會有巨大的市場。
目前有技術(shù)能力的公司都看到這市場的潛力,但還是各自為政,軟件硬件都在用自己的一套,完全是自己的封閉系統(tǒng),這樣的研發(fā)成本很高,落地成本也很高。最近我調(diào)研了這個這塊市場,我相信很快有人會要做一個開放性的人臉識別攝像頭硬件,可以提供給考勤和安全門禁的行業(yè)提供基礎(chǔ)的解決方案,從而降低研發(fā)成本和落地成本,對這市場的硬件公司也將會有一個大的洗牌。
六、后記
經(jīng)過這幾周的業(yè)內(nèi)調(diào)研了解,這樣的開放標(biāo)準硬件和服務(wù)器平臺其實有極大的市場,硬件平臺不只提供標(biāo)準模塊和算法,不做自己的行業(yè)應(yīng)用,提供一個簡單易用的解決方案賦能給這些傳統(tǒng)行業(yè),依賴傳統(tǒng)行業(yè)的渠道和落地實施。不僅僅可以在標(biāo)準硬件上能夠有一個大規(guī)模的銷售量,同時能夠大量收集到人臉數(shù)據(jù)庫和使用數(shù)據(jù),為真正的人工智能識別系統(tǒng)提供大數(shù)據(jù)支持,這才是算法公司的核心價值。歡迎一些有算法能力和神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)的兄弟或者公司一起交流探討。
作者介紹:黃小良, 深圳智安物聯(lián)科技有限公司 CEO ,電子圈資深成員,5年產(chǎn)品研發(fā),10年半導(dǎo)體分銷, 5年創(chuàng)業(yè),從事物聯(lián)網(wǎng)智能家居。個人微信號“iSuren”,歡迎交流。
由ELEXCON深圳國際電子展暨嵌入式系統(tǒng)展和百度攜手舉辦的“Hello AI科技聯(lián)展”即將于12月20-22日在深圳會展中心2號館舉辦。此前,百度AI科普大巴先后走過北京、廈門、重慶、武漢等城市,每到一處都能掀起“HELLO AI”人工智能熱潮,給千萬民眾展示AI核心技術(shù),感受AI生活的便利神奇。
此次ELEXCON深圳國際電子展暨嵌入式系統(tǒng)展上,更有人工智能/大數(shù)據(jù)專區(qū),讓市民身臨其境體驗未來科技生活!
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9205瀏覽量
85558 -
人工智能
+關(guān)注
關(guān)注
1791文章
47352瀏覽量
238791 -
人臉識別
+關(guān)注
關(guān)注
76文章
4012瀏覽量
81968
發(fā)布評論請先 登錄
相關(guān)推薦
《DNK210使用指南 -CanMV版 V1.0》第四十五章 人臉識別實驗
基于OpenCV的人臉識別系統(tǒng)設(shè)計
人臉識別技術(shù)的優(yōu)缺點有哪些
人臉識別技術(shù)的原理介紹
如何設(shè)計人臉識別的神經(jīng)網(wǎng)絡(luò)
人臉識別模型訓(xùn)練流程
人臉識別模型訓(xùn)練是什么意思
人臉檢測和人臉識別的區(qū)別是什么
人臉檢測與識別的方法有哪些
![](https://file1.elecfans.com/web2/M00/D4/DD/wKgZomYmGWGAH81bAAD5d5Nr-18309.png)
![](https://file1.elecfans.com/web2/M00/C3/D1/wKgaomXogymADYfOAAPo-caaYiI456.png)
![](https://file1.elecfans.com/web2/M00/C2/E8/wKgZomXogu6ADnvQAAIKxJUSxOY841.png)
評論