商湯的優(yōu)勢(shì)還是在于AI人才的儲(chǔ)備和算法優(yōu)勢(shì)。目前在城市級(jí)萬(wàn)路規(guī)模的視頻監(jiān)控項(xiàng)目,AI尚未普及,一旦達(dá)到一定規(guī)模,對(duì)平臺(tái)端算法和算力的需求將會(huì)極高。
集微網(wǎng)消息,近年來(lái),隨著安防體系的日漸壯大、監(jiān)控點(diǎn)的不斷擴(kuò)張和高清監(jiān)控設(shè)備的普及,監(jiān)控獲得的圖像視頻信息呈現(xiàn)爆炸式的增長(zhǎng)。傳統(tǒng)視頻監(jiān)控系統(tǒng)的存儲(chǔ)和檢索等面臨著巨大的挑戰(zhàn),如何快速、高效地從海量圖像視頻中提取出有用的信息至關(guān)重要。
為此,人們把人臉識(shí)別技術(shù)引入了視頻監(jiān)控系統(tǒng)中,人臉識(shí)別技術(shù)很大程度上依賴于卷積神經(jīng)網(wǎng)絡(luò)的支持,而卷積神經(jīng)網(wǎng)絡(luò)需要龐大的計(jì)算量。
同時(shí),現(xiàn)有的視頻監(jiān)控系統(tǒng)中,人臉檢測(cè)識(shí)別都是在后端服務(wù)器實(shí)現(xiàn)的,前端只負(fù)責(zé)圖像數(shù)據(jù)的采集編碼及傳輸。這種前后端結(jié)合操作的模式,需要較大網(wǎng)絡(luò)帶寬;同時(shí),由于傳輸?shù)囊曨l流數(shù)據(jù)中大部分都是無(wú)用的信息,大大降低了后端服務(wù)器對(duì)有效數(shù)據(jù)提取的效率。因此一種能夠直接應(yīng)用在前端拍攝裝置上的人臉識(shí)別方法顯得尤為重要。
基于這些問(wèn)題,商湯科技在17年8月31日申請(qǐng)了一項(xiàng)名為“人臉圖像檢索方法和系統(tǒng)、拍攝裝置、計(jì)算機(jī)存儲(chǔ)介質(zhì)”的發(fā)明專利(申請(qǐng)?zhí)枺?01710774389.9),申請(qǐng)人為深圳市商湯科技有限公司。
根據(jù)目前公開(kāi)的專利資料,讓我們一起來(lái)了解一下這項(xiàng)人臉識(shí)別技術(shù)吧。
如上圖所示為人臉圖像檢索方法的流程示意圖,這樣的方法將直接應(yīng)用于拍攝裝置上。首先通過(guò)卷積神經(jīng)網(wǎng)絡(luò)獲得待檢索圖像對(duì)應(yīng)的待檢索人臉信息。卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)處理器配置對(duì)應(yīng)的卷積計(jì)算配置信息,卷積神經(jīng)網(wǎng)絡(luò)包括至少一個(gè)卷積層,我們知道卷積層的層數(shù)越多,一般檢測(cè)效果也會(huì)越好,并且這個(gè)卷積神經(jīng)網(wǎng)絡(luò)是可以預(yù)先訓(xùn)練好的。同時(shí),這個(gè)步驟通過(guò)卷積神經(jīng)網(wǎng)絡(luò)處理獲得對(duì)應(yīng)的待檢索人臉信息,將后續(xù)檢索中的圖像檢索轉(zhuǎn)換為人臉信息檢索,使檢索更快捷,無(wú)需后續(xù)轉(zhuǎn)換。
其次,基于待檢索人臉信息從數(shù)據(jù)庫(kù)中查找匹配的預(yù)設(shè)人臉圖像信息,數(shù)據(jù)庫(kù)中保存有預(yù)設(shè)人臉圖像信息。通過(guò)設(shè)置數(shù)據(jù)庫(kù)在拍攝裝置中實(shí)現(xiàn)了人臉的檢測(cè)與識(shí)別工作,大大降低了網(wǎng)絡(luò)帶寬的要求,提高了數(shù)據(jù)傳輸效率。
最后,輸出待檢索人臉信息匹配的預(yù)設(shè)人臉圖像信息。通過(guò)這樣的方案,卷積神經(jīng)網(wǎng)絡(luò)獲得待檢索圖像對(duì)應(yīng)的待檢索人臉信息,卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)處理器配置對(duì)應(yīng)的卷積計(jì)算配置信息。由于卷積神經(jīng)網(wǎng)絡(luò)設(shè)置了卷積計(jì)算配置信息,輸入到卷積神經(jīng)網(wǎng)絡(luò)中各卷積層中的圖像的位寬都與卷積層相對(duì)應(yīng),提高了卷積層的處理效率,并輸入的待檢索圖像可以快速準(zhǔn)確的得到待檢索人臉信息,既解決了定點(diǎn)運(yùn)算計(jì)算精度低及影響計(jì)算結(jié)果準(zhǔn)確度的問(wèn)題,同時(shí)也提高了卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算精度。
在了解了系統(tǒng)的整體方案之后,接下來(lái)我們?cè)賮?lái)看看該方法的硬件實(shí)施方案吧。
如上圖所示為該拍攝裝置中的組成硬件結(jié)構(gòu)示意圖,其中包括圖像采集模塊、ISP處理模塊、存儲(chǔ)模塊、FPGA SoC模塊、中央處理器、通信模塊以及供電系統(tǒng)。
圖像采集模塊,用于采集視頻流,并基于每個(gè)出現(xiàn)在視頻流中的人臉圖像在采集的視頻流中篩選得到至少一個(gè)圖像;ISP處理模塊,用于對(duì)所有圖像進(jìn)行質(zhì)量篩選,得到至少一個(gè)人臉圖像質(zhì)量達(dá)到設(shè)定閾值的第一圖像;存儲(chǔ)模塊,用于存儲(chǔ)對(duì)應(yīng)第一圖像的預(yù)設(shè)人臉圖像信息。
FPGA SoC模塊包括硬件監(jiān)測(cè)和中央處理,硬件監(jiān)測(cè)實(shí)現(xiàn)通過(guò)卷積神經(jīng)網(wǎng)絡(luò)獲得待檢索圖像對(duì)應(yīng)的待檢索人臉信息;中央處理用于為卷積神經(jīng)網(wǎng)絡(luò)配置對(duì)應(yīng)的卷積計(jì)算配置信息;通信模塊,通過(guò)通信模塊可將得到的匹配的預(yù)設(shè)人臉圖像信息發(fā)送出去,同時(shí)還可以根據(jù)該預(yù)設(shè)人臉圖像信息屬于白名單或黑名單發(fā)出相應(yīng)的信息到預(yù)設(shè)的客戶端中。
以上就是商湯基于神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別的方案,通過(guò)在拍攝裝置設(shè)置的數(shù)據(jù)庫(kù)中檢索匹配的預(yù)設(shè)人臉圖像信息,實(shí)現(xiàn)了實(shí)時(shí)人臉檢索的效果,提高了檢索效率,不僅解決了現(xiàn)有方法中都在后端進(jìn)行處理的某些局限弊端,同時(shí)也實(shí)現(xiàn)了將檢測(cè)裝置布置在前端時(shí)代價(jià)高昂的問(wèn)題。人臉識(shí)別技術(shù)在我們的生活中也非常的常見(jiàn),而商湯的這項(xiàng)技術(shù)無(wú)疑會(huì)使得我們的生活得到更多的便利。
-
AI
+關(guān)注
關(guān)注
87文章
34270瀏覽量
275427 -
人臉識(shí)別
+關(guān)注
關(guān)注
76文章
4069瀏覽量
83681 -
商湯科技
+關(guān)注
關(guān)注
8文章
553瀏覽量
36657
發(fā)布評(píng)論請(qǐng)先 登錄
機(jī)器視覺(jué)技術(shù)應(yīng)用之人臉識(shí)別
人臉識(shí)別技術(shù)原理解析
[SenesTime 商湯集團(tuán)][深圳實(shí)習(xí)] C++開(kāi)發(fā)工程師&Java 開(kāi)發(fā)工程師
奇谷人臉識(shí)別技術(shù)
別怕,人臉識(shí)別技術(shù)帶你回家
人臉識(shí)別技術(shù)的60年發(fā)展史
人臉識(shí)別技術(shù)的優(yōu)缺點(diǎn)
人臉識(shí)別優(yōu)勢(shì)明顯,未來(lái)將成為識(shí)別主導(dǎo)技術(shù)
人臉識(shí)別的原理揭秘
阿里人臉識(shí)別安全技術(shù)獲專利
人臉識(shí)別是什么_人臉識(shí)別技術(shù)原理

評(píng)論