在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

攝像頭相關(guān)的人工智能研究成果

LiveVideoStack ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-25 17:40 ? 次閱讀

本文來(lái)自馭勢(shì)科技人工智能組組長(zhǎng)潘爭(zhēng)在LiveVideoStackCon 2017大會(huì)上的分享,并由LiveVideoStack整理而成。潘爭(zhēng)回顧了AI在圖像識(shí)別領(lǐng)域的歷史與難點(diǎn),以及在安防和自動(dòng)駕駛方面的實(shí)現(xiàn)思路。

谷歌的人工智能平臺(tái)Alpha Go讓AI再次進(jìn)入了普通老百姓的視野,我記得2016年3月時(shí)Alpha Go第一輪測(cè)試結(jié)果就令大家十分震驚。隨著技術(shù)的進(jìn)步,AI的能力一定會(huì)越來(lái)越強(qiáng)。我們可以看到近兩年AI在深度學(xué)習(xí)方面的技術(shù)進(jìn)展成果顯著。今天我為大家準(zhǔn)備了一些最近與攝像頭相關(guān)的人工智能研究成果。

概覽:

攝像頭里的數(shù)據(jù)寶藏

視覺(jué)識(shí)別的挑戰(zhàn)與應(yīng)對(duì)

AI+安防實(shí)踐

AI+自動(dòng)駕駛實(shí)踐

今天我的分享內(nèi)容主要分為以下幾點(diǎn):第一是我們生活中的這些攝像頭所采集的數(shù)據(jù)中隱藏了哪些值得挖掘的寶藏,以及如果要去挖掘有價(jià)值的數(shù)據(jù)需要面臨的一些挑戰(zhàn)與應(yīng)對(duì)的方法;第二是我在安防與自動(dòng)駕駛領(lǐng)域應(yīng)用AI的一些實(shí)踐經(jīng)驗(yàn)。

1. 攝像頭里的數(shù)據(jù)寶藏

大家可以設(shè)想一下自己周?chē)卸嗌儆^察我們的攝像頭,有我們隨身攜帶的手機(jī)、平板電腦等移動(dòng)設(shè)備的前后攝像頭;如果你開(kāi)車(chē),你的車(chē)至少會(huì)有一兩個(gè)攝像頭;當(dāng)你走在大街上或商場(chǎng)、超市里時(shí),隨便一抬頭都能看到一個(gè)監(jiān)控?cái)z像頭。可以說(shuō)我們的生活布滿(mǎn)了攝像頭,其中記錄了我們生活一點(diǎn)一滴的數(shù)據(jù)便具有了非凡價(jià)值。例如商場(chǎng)的管理人員可通過(guò)攝像頭判斷此時(shí)商場(chǎng)里有多少顧客,大致掌握顧客的男女比例,年齡層次,從而掌握潛在消費(fèi)群體的實(shí)時(shí)動(dòng)向;也可以通過(guò)攝像頭搜尋經(jīng)常前來(lái)消費(fèi)的顧客,并在正確的位置精準(zhǔn)投放相應(yīng)廣告吸引其消費(fèi)從而增加銷(xiāo)售額。而在安防領(lǐng)域,警察可通過(guò)安裝在街道上的攝像頭監(jiān)控預(yù)防群體事件的發(fā)生,迅速識(shí)別定位逃犯并掌握其逃跑路徑從而實(shí)現(xiàn)快速抓捕。還有在自動(dòng)駕駛領(lǐng)域,通過(guò)汽車(chē)上集成的多部攝像頭獲取的數(shù)據(jù)可以告訴自動(dòng)駕駛系統(tǒng)周?chē)?chē)的數(shù)量、相對(duì)速度與距離等,也可識(shí)別車(chē)道線位置,推斷汽車(chē)是否偏離車(chē)道,并在需要變道或剎車(chē)時(shí)及時(shí)作出反應(yīng),保障自動(dòng)駕駛系統(tǒng)的正常運(yùn)行。從攝像頭中發(fā)掘有價(jià)值的數(shù)據(jù)并加以有效利用,無(wú)論對(duì)安防領(lǐng)域還是自動(dòng)駕駛領(lǐng)域而言都非常重要。當(dāng)然數(shù)據(jù)挖掘與處理的過(guò)程也充滿(mǎn)挑戰(zhàn)。

2. 視覺(jué)識(shí)別問(wèn)題中的挑戰(zhàn)與應(yīng)對(duì)

例如上面的這張圖,也許一個(gè)三歲的小孩也能夠識(shí)別出圖片中的物體是一只貓,而對(duì)計(jì)算機(jī)來(lái)說(shuō),這張圖可能只是一系列的數(shù)字。如果我們想通過(guò)這一系列的數(shù)字識(shí)別出這是一只貓則可能會(huì)遇到非常多的挑戰(zhàn)。

挑戰(zhàn)1:視角變化

而隨著視角的變化,例如上圖的同一張人臉會(huì)呈現(xiàn)出非常明顯的差異

挑戰(zhàn)2:光影變化

光影的變化同樣至關(guān)重要,由于光源位置的不同,同樣的幾只企鵝,有可能是全黑的,也有可能是全白的,這對(duì)視覺(jué)識(shí)別也非常具有挑戰(zhàn)性。

挑戰(zhàn)3:尺度變化

姚明與小孩雖存在明顯的尺度差異,但都屬于人類(lèi)。視覺(jué)識(shí)別系統(tǒng)必須能夠?qū)Σ煌叨鹊奈矬w準(zhǔn)確進(jìn)行歸類(lèi)。

挑戰(zhàn)4:形狀變化

處于不同形態(tài)的同一物體同樣是識(shí)別的難點(diǎn),例如無(wú)論“大黃蜂”處于汽車(chē)形態(tài)還是機(jī)器人形態(tài),視覺(jué)識(shí)別系統(tǒng)都應(yīng)將其識(shí)別成“大黃蜂”。

挑戰(zhàn)5:遮擋變化

更大的挑戰(zhàn)在于很多視覺(jué)識(shí)別都需要面臨的遮擋變化,我們必須保證在復(fù)雜環(huán)境的遮擋下仍能夠準(zhǔn)確識(shí)別圖片中的一匹馬與騎馬的人。

挑戰(zhàn)6:背景干擾

還需要解決的是背景干擾問(wèn)題,我們可以輕易識(shí)別出上圖中的人與金錢(qián)豹,但對(duì)計(jì)算機(jī)而言,因?yàn)槟繕?biāo)主體的紋理與背景幾乎難以分別,能夠準(zhǔn)確識(shí)別出同樣結(jié)果的難度非常大。

挑戰(zhàn)7:類(lèi)內(nèi)差距

最后一項(xiàng)挑戰(zhàn)是類(lèi)內(nèi)差距,雖然都是椅子,但設(shè)計(jì)與用處的不同使其外觀差距非常大,而我們希望視覺(jué)識(shí)別算法都能將其識(shí)別為一張椅子。

如何有效解決視覺(jué)識(shí)別領(lǐng)域上述這么多挑戰(zhàn)?

2.1 深度學(xué)習(xí)——卷積神經(jīng)網(wǎng)絡(luò)

如果讓大家完成這樣一個(gè)Python函數(shù),輸入一張圖片的數(shù)據(jù),輸出我們期望得到的圖片類(lèi)型,該如何完成?其實(shí)這個(gè)問(wèn)題已經(jīng)困擾了計(jì)算機(jī)視覺(jué)科學(xué)家大概半個(gè)多世紀(jì)的時(shí)間,從計(jì)算機(jī)被發(fā)明開(kāi)始大家就在思考這個(gè)問(wèn)題,直到最近幾年才有了一個(gè)比較正式的回答,就是我們經(jīng)常提到的深度學(xué)習(xí),具體來(lái)說(shuō)是一個(gè)多層卷積神經(jīng)網(wǎng)絡(luò)。上圖展示了這樣一個(gè)卷積神經(jīng)網(wǎng)絡(luò)的例子,在卷積神經(jīng)網(wǎng)絡(luò)的左邊輸入的是一張圖像的數(shù)據(jù),右邊輸出的是我們期待的圖像所屬類(lèi)別。在這個(gè)網(wǎng)絡(luò)中我們可以看到每一個(gè)藍(lán)色的方框都代表一次卷積操作,之所以叫它多層卷積神經(jīng)網(wǎng)絡(luò)就是因?yàn)橐粡垐D片從輸入原始數(shù)據(jù)到輸出對(duì)應(yīng)類(lèi)別需要經(jīng)過(guò)多次卷積操作,像這個(gè)網(wǎng)絡(luò)需要經(jīng)過(guò)22層卷積才能準(zhǔn)確識(shí)別出圖像所屬的類(lèi)別屬性。每個(gè)卷積都會(huì)有一個(gè)卷積核,這個(gè)卷積核就是我們希望從海量數(shù)據(jù)中學(xué)習(xí)到的參數(shù),學(xué)習(xí)不同的任務(wù)可以得出不同的參數(shù)。而這個(gè)學(xué)習(xí)訓(xùn)練的算法一般是根據(jù)具體任務(wù)通過(guò)使用反向傳播算法進(jìn)行精準(zhǔn)識(shí)別并去學(xué)習(xí)出每一個(gè)卷積核的對(duì)應(yīng)參數(shù)來(lái)。那么這樣一個(gè)卷積神經(jīng)網(wǎng)絡(luò)可以達(dá)到怎樣的圖像識(shí)別性能呢?

這個(gè)問(wèn)題也是在近幾年才有了一個(gè)比較好的回答,我給大家舉個(gè)例子: ImageNet比賽是一項(xiàng)解決通用圖像識(shí)別分類(lèi)問(wèn)題的比賽,通過(guò)統(tǒng)計(jì)計(jì)算機(jī)識(shí)別并歸類(lèi)數(shù)據(jù)集中一千類(lèi)圖片的錯(cuò)誤率來(lái)衡量其視覺(jué)識(shí)別能力的高低。人如果參加ImageNet,錯(cuò)誤率會(huì)保持在5.1%左右。而在深度學(xué)習(xí)面世之前的2011年,ImageNet冠軍的錯(cuò)誤率可達(dá)到25.8%,但在2012深度學(xué)習(xí)面世以后,ImageNet冠軍的錯(cuò)誤率一下降到了16.4%,并且從那之后一直處于直線下降的狀態(tài),直到2015年的正確率已經(jīng)下降到比人還低的3.57%。在人工智能的圍棋還未超越人類(lèi)的2015年,計(jì)算機(jī)在通用圖像識(shí)別領(lǐng)域的性能已經(jīng)超越了人類(lèi),能達(dá)到這樣的成績(jī),卷積神經(jīng)網(wǎng)絡(luò)功不可沒(méi)。

2.2 進(jìn)一步發(fā)展的卷積神經(jīng)網(wǎng)絡(luò)

上圖是近幾年我們常用的深度卷積神經(jīng)網(wǎng)絡(luò)的大概結(jié)構(gòu),深度卷積神經(jīng)網(wǎng)絡(luò)最早是由Yann LeCun在1989年提出,當(dāng)時(shí)是一個(gè)僅有5層的卷積神經(jīng)網(wǎng)絡(luò),現(xiàn)在Yann LeCun在Facebook的人工智能研究院作為主任繼續(xù)推進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的研究。最初卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)非常的淺,僅有5層,并且那時(shí)只能完成一些手寫(xiě)體方面的簡(jiǎn)單識(shí)別任務(wù)。在那之后人們對(duì)卷積神經(jīng)網(wǎng)絡(luò)的研究持續(xù)了二十多年,一直到2012年,人們才提出能夠勝任像ImageNet這樣復(fù)雜識(shí)別任務(wù)的更先進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)。AlexNet在2012年借助這樣一個(gè)8層的卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)成為當(dāng)年ImageNet比賽的冠軍,從那之后,又有很多不同的卷積神經(jīng)網(wǎng)絡(luò)被研發(fā)出來(lái),總的趨勢(shì)是越來(lái)越深。例如2013年達(dá)到19層的VGG、2014年Google提出的達(dá)到22層的GoogLeNet,而2015年微軟亞洲研究院研制的多達(dá)152層的卷積神經(jīng)網(wǎng)絡(luò)ResNet其圖像識(shí)別性能已超越人類(lèi)。從卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展我們不難看出,網(wǎng)絡(luò)越深其表達(dá)能力越強(qiáng),卷積神經(jīng)網(wǎng)絡(luò)所能表達(dá)的數(shù)學(xué)函數(shù)復(fù)雜程度就會(huì)越高,這就使其在處理復(fù)雜圖象識(shí)別任務(wù)時(shí)能夠達(dá)到更高的正確率。當(dāng)然隨著網(wǎng)絡(luò)加深增多的是卷積盒的參數(shù),對(duì)應(yīng)計(jì)算量與深度學(xué)習(xí)的訓(xùn)練難度也會(huì)增大,接下來(lái)我將講述近幾年大家在研究深度學(xué)習(xí)時(shí)面臨的三項(xiàng)核心問(wèn)題以及提出的一些能夠解決相應(yīng)問(wèn)題的算法思想。

2.3 視覺(jué)問(wèn)題的深度學(xué)習(xí)方法

之前提到的ImageNet比賽是一個(gè)通用的模擬圖像識(shí)別與分類(lèi)的比賽,并不解決實(shí)際問(wèn)題。與圍棋類(lèi)似,并不能為我們創(chuàng)造任何經(jīng)濟(jì)價(jià)值。如果想應(yīng)用于實(shí)際中的視覺(jué)識(shí)別情景則還需解決以下幾大類(lèi)問(wèn)題:語(yǔ)義分割、物體檢測(cè)、對(duì)比驗(yàn)證。

2.3.1 語(yǔ)義分割

圖像分類(lèi)問(wèn)題需要識(shí)別一張圖片并告訴我們這張圖片中物體的類(lèi)別,簡(jiǎn)而言之就是輸入一張圖片,給出一個(gè)類(lèi)別。語(yǔ)義分割就是希望針對(duì)一張圖片中的每個(gè)像素都輸出一個(gè)類(lèi)別,其中有很多解決方案,例如這幾年提出的FCN、Enet、PSPNet或ICnet等等。這些方法背后的基本框架都是全卷積網(wǎng)絡(luò)。這里的全卷積網(wǎng)絡(luò)與剛才提到的分類(lèi)網(wǎng)絡(luò)唯一不同之處在于全卷積網(wǎng)絡(luò)并不只輸出一個(gè)分類(lèi)標(biāo)簽,而是輸出多個(gè)分類(lèi)結(jié)果,每個(gè)分類(lèi)結(jié)果都對(duì)應(yīng)了圖像中的一個(gè)像素的類(lèi)型值。訓(xùn)練時(shí)會(huì)對(duì)每個(gè)像素分類(lèi)的結(jié)果進(jìn)行誤差計(jì)算,并用反向傳播算法得出訓(xùn)練后的網(wǎng)絡(luò)參數(shù)。

2.3.2 物體檢測(cè)

初期的物體檢測(cè)準(zhǔn)確率很低,無(wú)法滿(mǎn)足應(yīng)用需求。近幾年隨著Faster RCNN、RFCN、SSD等方法的出現(xiàn),物體檢測(cè)的準(zhǔn)確率已經(jīng)基本達(dá)到實(shí)際應(yīng)用的需求。以上這些基于深度學(xué)習(xí)的物體檢測(cè)方法同樣使用全卷積網(wǎng)絡(luò)來(lái)預(yù)測(cè)出物體的每一個(gè)位置,在推斷出此區(qū)域是否屬于某個(gè)物體的同時(shí)對(duì)物體的類(lèi)別、位置與大小進(jìn)行預(yù)測(cè)。與之前的預(yù)測(cè)相比,物體檢測(cè)增加了位置與大小兩個(gè)預(yù)測(cè)維度。如果對(duì)這樣的預(yù)測(cè)的結(jié)果還不滿(mǎn)意的話也可像Faster RCNN這樣將相應(yīng)區(qū)域的圖片或特性分離出并再過(guò)一次網(wǎng)絡(luò)進(jìn)行第二次的分類(lèi)與回歸,這種對(duì)目標(biāo)的多重計(jì)算有助于提升輸出結(jié)果的準(zhǔn)確性。目前最好的物體檢測(cè)方法就是類(lèi)似于Faster RCNN這樣分兩階段的方法,如果大家想嘗試這種物體檢測(cè)方面的應(yīng)用也可從此方法開(kāi)始。

2.3.3 對(duì)比驗(yàn)證

對(duì)比驗(yàn)證簡(jiǎn)單來(lái)說(shuō)就是對(duì)兩個(gè)圖像進(jìn)行對(duì)比并推斷這兩個(gè)圖像是否為同一個(gè)類(lèi)別,最簡(jiǎn)單的應(yīng)用就是人臉識(shí)別。例如借助計(jì)算機(jī)將手機(jī)拍攝的一張人像照片與一張身份證上的照片進(jìn)行對(duì)比并推斷是否為同一個(gè)人。這項(xiàng)技術(shù)在淘寶、支付寶等平臺(tái)都有應(yīng)用,也可用與跟蹤和ReID等方面。這里的跟蹤是指用一個(gè)攝像頭拍攝連續(xù)多幀照片后,識(shí)別并鎖定第一幀里的某個(gè)物體,然后跟蹤后續(xù)幀中這個(gè)物體的移動(dòng)軌跡。

如果這些用于跟蹤物體的圖片來(lái)自不同的攝像頭,那么這就變成了一個(gè)ReID問(wèn)題。ReID在安防領(lǐng)域是一個(gè)非常重要的應(yīng)用,例如一個(gè)小偷在A攝像頭下作案時(shí)被拍攝圖像后,我希望根據(jù)這張圖像在其他攝像頭中搜尋并鎖定這個(gè)小偷,以此來(lái)推測(cè)其作案移動(dòng)的路徑,毫無(wú)疑問(wèn)這會(huì)為警方的刑偵破案提供很大幫助。無(wú)論是人臉識(shí)別還是RelD,其技術(shù)背景都是Siamese network。

它的原理很簡(jiǎn)單,就是將兩張圖片經(jīng)過(guò)同一個(gè)網(wǎng)絡(luò)提取特征。在訓(xùn)練此網(wǎng)絡(luò)時(shí)我們希望盡量縮小同一張人臉照片輸出結(jié)果的差距,擴(kuò)大不同人臉照片輸出結(jié)果的差距。通過(guò)這種訓(xùn)練方式能夠讓網(wǎng)絡(luò)學(xué)習(xí)到如何分析比對(duì)同一張人臉具有什么相似的特征,不同的人臉具有什么不同的特征。在人臉識(shí)別方面,計(jì)算機(jī)更早地超過(guò)人類(lèi)。大概2013年在LFW人臉驗(yàn)證比賽上,人類(lèi)對(duì)于臉部的識(shí)別驗(yàn)證準(zhǔn)確率在97%左右,而計(jì)算機(jī)已可達(dá)到99%以上,這無(wú)疑是深度學(xué)習(xí)在人臉驗(yàn)證領(lǐng)域的突破。

之前我與大家分享的都是一些籠統(tǒng)的方法,接下來(lái)我會(huì)結(jié)合過(guò)去我在安防與自動(dòng)駕駛領(lǐng)域的工作經(jīng)驗(yàn)為大家介紹一些研究成果,

3. AI+安防

首先說(shuō)一下安防,在安防領(lǐng)域有以下幾類(lèi)大家比較關(guān)心的問(wèn)題。第一個(gè)問(wèn)題是通過(guò)攝像頭確認(rèn)目標(biāo)的位置也就是“人在哪里?”。知道人在哪里之后就需要明確目標(biāo)屬性“你是誰(shuí)?”、“你從哪里來(lái)?”、“你要到哪里去?”這些看似充滿(mǎn)哲學(xué)意味的問(wèn)題同樣也是安防領(lǐng)域最重要的三個(gè)問(wèn)題。回答這三個(gè)問(wèn)題之后我們還希望確認(rèn)目標(biāo)的行為特征“人做了什么?”這對(duì)安防領(lǐng)域而言同樣重要。接下來(lái)讓我們看一下,如何解決這幾個(gè)問(wèn)題。

3.1 “人在哪里?”

首先我們需要確認(rèn)“人在哪里?”。安防領(lǐng)域中最基礎(chǔ)的便是對(duì)物體的檢測(cè),例如上圖展示了一個(gè)在安防場(chǎng)景里進(jìn)行人物檢測(cè)的實(shí)例。我們使用類(lèi)似Faster RCNN技術(shù)對(duì)這樣一個(gè)安防場(chǎng)景中人的上半身進(jìn)行檢測(cè),檢測(cè)上半身主要是因?yàn)槿俗钪匾奶卣骷性谏习肷恚掳肷斫?jīng)常會(huì)被其他物體遮擋,同理上半身的特征暴露幾率更高,更容易進(jìn)行特征識(shí)別。因?yàn)閭鹘y(tǒng)Faster RCNN方法在識(shí)別速度上處于劣勢(shì),所以我們對(duì)Faster RCNN進(jìn)行了一些簡(jiǎn)化,使其在識(shí)別速度上有了比較大的提升,并且能夠允許我們僅借助移動(dòng)端GPU就可實(shí)現(xiàn)實(shí)時(shí)檢測(cè)的效果。

為了驗(yàn)證此算法的運(yùn)行極限,我們進(jìn)行了一個(gè)規(guī)模更大的實(shí)驗(yàn)。此實(shí)驗(yàn)場(chǎng)景為北京站前廣場(chǎng),這里人流密集,比一般的監(jiān)控場(chǎng)景更復(fù)雜,我們想通過(guò)此實(shí)驗(yàn)測(cè)試我們算法可同時(shí)檢測(cè)人數(shù)的極限。經(jīng)過(guò)測(cè)試我們發(fā)現(xiàn)即便在如此大的場(chǎng)景之下算法依舊能夠較穩(wěn)定地檢測(cè)出場(chǎng)景中中絕大多數(shù)行人,漏檢與誤檢幾率也維持在較低水平。我們?cè)诖_認(rèn)目標(biāo)位置之后需要進(jìn)一步確認(rèn)目標(biāo)的移動(dòng)軌跡與行為動(dòng)機(jī)。

3.2 “人從哪里來(lái),到哪里去?”

上圖是一個(gè)較典型的物體跟蹤實(shí)驗(yàn)情景,我們讓這些群眾演員隨機(jī)游走,通過(guò)深度學(xué)習(xí)方法對(duì)每個(gè)人的運(yùn)動(dòng)軌跡進(jìn)行跟蹤。從左上角的圖中我們可以看到每個(gè)人身上都會(huì)有一個(gè)圈,如果圈的顏色沒(méi)有變化說(shuō)明對(duì)這個(gè)人保持正常的跟蹤狀態(tài)。可以看到利用這種檢測(cè)跟蹤技術(shù)可穩(wěn)定地跟蹤大部分目標(biāo)。借助攝像頭輸出的深度圖,我們還可以如右下角圖片展示的那樣得出每個(gè)人在三維空間中的位置并變換視角進(jìn)行監(jiān)控,或是如在左下角圖片展示的那樣得到一個(gè)俯視的運(yùn)行軌跡,這樣就可得知每個(gè)人在監(jiān)控畫(huà)面當(dāng)中的位置動(dòng)態(tài)變化軌跡。

3.3 “這些人是誰(shuí)?”

跟蹤上每一個(gè)人之后,更重要的是確認(rèn)跟蹤目標(biāo)的身份。安防領(lǐng)域的終極目標(biāo)就是希望明確監(jiān)控畫(huà)面中每個(gè)人的身份信息,而能從一個(gè)人的圖像中獲取到的最明顯的身份特征信息就是人臉。我開(kāi)發(fā)了這樣一項(xiàng)技術(shù)——遠(yuǎn)距離人臉識(shí)別。在上圖展示的大場(chǎng)景中我們可以看到其中大部分人離攝像頭的距離至少有30米~40米,在這樣一個(gè)遠(yuǎn)距離監(jiān)控場(chǎng)景下人臉采到的圖像質(zhì)量會(huì)出現(xiàn)明顯的損失,例如人臉的位姿變化。我們希望借助在這樣一個(gè)不佳的監(jiān)控場(chǎng)景中獲取的人臉圖片與人臉特征庫(kù)中的證件信息進(jìn)行比對(duì)并獲取目標(biāo)人物的身份信息,其原理也是剛才提到的Siamese Network——通過(guò)使用幾千萬(wàn)甚至上億數(shù)據(jù)進(jìn)行訓(xùn)練,得出一個(gè)較為穩(wěn)定的人臉特征并在人臉庫(kù)中檢索出符合此特征的目標(biāo)人物身份信息,從而識(shí)別目標(biāo)身份。

3.4 “這些人在干什么?”

安防領(lǐng)域最后關(guān)心的是目標(biāo)的行為特征“這個(gè)人在干什么?”其本質(zhì)是明確每個(gè)人的各個(gè)關(guān)節(jié)的運(yùn)動(dòng)狀態(tài),我們稱(chēng)之為POSE識(shí)別。雖然POSE識(shí)別看上去并不屬于檢測(cè)、跟蹤或是語(yǔ)義分割的范疇,但我們也可將其歸結(jié)為一種物體檢測(cè),只不過(guò)我們檢測(cè)的不再是人的運(yùn)動(dòng)軌跡,而是檢測(cè)每個(gè)人的脖子、肩膀、肘關(guān)節(jié)等部分的相對(duì)位置,這與之前的物體檢測(cè)相比更為復(fù)雜。近幾年,借助深度學(xué)習(xí)技術(shù),POSE識(shí)別取得了非常明顯的進(jìn)步。微軟Xbox 360上配備的kinect便是通過(guò)可感知深度的攝像頭對(duì)一兩個(gè)人進(jìn)行POSE識(shí)別而現(xiàn)在隨著技術(shù)的發(fā)展,即便僅通過(guò)普通的RGB攝像頭也能實(shí)現(xiàn)對(duì)整個(gè)廣場(chǎng)上多個(gè)目標(biāo)同時(shí)進(jìn)行POSE識(shí)別,這也是近幾年深度學(xué)習(xí)的一個(gè)重要突破。通過(guò)這種實(shí)時(shí)POSE識(shí)別我們不光可識(shí)別每個(gè)人在廣場(chǎng)中的位置、運(yùn)動(dòng)軌跡,還可識(shí)別每個(gè)人的動(dòng)作以及動(dòng)作背后隱藏的人與人之間的關(guān)系,從而在監(jiān)控畫(huà)面中獲取更多有價(jià)值的信息。

4. AI+自動(dòng)駕駛

之前我們講述了AI在安防監(jiān)控領(lǐng)域的一些應(yīng)用,接下來(lái)我會(huì)介紹一些最近正在嘗試的有關(guān)自動(dòng)駕駛方面的實(shí)踐。其實(shí)在自動(dòng)駕駛領(lǐng)域也需要很多攝像頭數(shù)據(jù),我們會(huì)在自動(dòng)駕駛汽車(chē)中安裝多個(gè)攝像頭。傳統(tǒng)汽車(chē)領(lǐng)域車(chē)身上的一兩個(gè)攝像頭主要用來(lái)拍攝汽車(chē)周?chē)沫h(huán)境圖像,而在自動(dòng)駕駛領(lǐng)域則需要更多的攝像頭完成更復(fù)雜的工作。例如特斯拉已經(jīng)在其還無(wú)法完全實(shí)現(xiàn)自動(dòng)駕駛的汽車(chē)上安裝了7個(gè)攝像頭;如果想要實(shí)現(xiàn)真正的自動(dòng)駕駛,為了保證畫(huà)面的無(wú)死角需要安裝更多攝像頭,那么攝像頭采集的數(shù)據(jù)能夠幫助我們做什么呢?很多信息需要通過(guò)攝像頭獲取,例如車(chē)道線、前后左右有無(wú)行人與車(chē)輛等障礙物、紅綠燈識(shí)別、可行駛區(qū)域識(shí)別等都是來(lái)源于通過(guò)攝像捕獲的數(shù)據(jù)。

4.1 車(chē)道線識(shí)別

圖片中展示的車(chē)道線識(shí)別,也許大家曾在一些行車(chē)記錄儀或ADOS中見(jiàn)過(guò)。但有別于傳統(tǒng)對(duì)單車(chē)道線的簡(jiǎn)單標(biāo)記,我們現(xiàn)在更關(guān)注的是多車(chē)道線識(shí)別。以前的車(chē)道線識(shí)別僅是左右各一根,而我們希望能夠識(shí)別一整條馬路上的多根車(chē)道線。這種對(duì)于多根車(chē)道線的識(shí)別,一方面可為處于自動(dòng)駕駛狀態(tài)下的車(chē)輛提供變道、駛出高速等路徑更改操作必要的數(shù)據(jù),另一方面能夠協(xié)助汽車(chē)進(jìn)行橫向定位。如果能夠同時(shí)識(shí)別出所有車(chē)道,自動(dòng)駕駛系統(tǒng)就能確認(rèn)汽車(chē)當(dāng)前在第幾條車(chē)道上,從而計(jì)算下一步需要切換到哪一條車(chē)道,這對(duì)自動(dòng)駕駛而言十分重要。檢測(cè)車(chē)道線可歸結(jié)為對(duì)物體的檢測(cè),大家可以將每條車(chē)道線理解為一個(gè)物體。當(dāng)然在面臨彎曲的車(chē)道線時(shí)還需要估計(jì)每條車(chē)道曲線的參數(shù),需要更多的處理分析以更好地模擬車(chē)道線的變化。

4.2 行人與車(chē)輛檢測(cè)

除了車(chē)道線識(shí)別,另外一個(gè)比較重要的問(wèn)題是對(duì)行人與車(chē)輛的實(shí)時(shí)檢測(cè)。這是安全性上十分重要的兩項(xiàng)指標(biāo),需要知曉周?chē)?chē)輛的位置、距離和速度才能獲取決策所需要的參數(shù)。上圖是我們?cè)诒本┧沫h(huán)這樣相對(duì)簡(jiǎn)單的封閉道路環(huán)境下進(jìn)行的車(chē)輛檢測(cè)實(shí)驗(yàn)。檢測(cè)車(chē)輛的算法與我們之前提到的在安防領(lǐng)域里檢測(cè)人的算法類(lèi)似,都是基于Faster RCNN架構(gòu),但自動(dòng)駕駛領(lǐng)域?qū)τ?jì)算能力的要求更高。因?yàn)槠?chē)的安全永遠(yuǎn)擺在第一位,并且經(jīng)過(guò)每一步計(jì)算更新出的行駛策略必須符合道路交通安全法規(guī),而我們?nèi)粘I钪惺褂玫腉PU遠(yuǎn)無(wú)法達(dá)到如此嚴(yán)格的性能要求。因此我們需要花很多的時(shí)間將神經(jīng)網(wǎng)絡(luò)盡可能精簡(jiǎn)與壓縮以實(shí)現(xiàn)更快的運(yùn)行速度,從而能夠在有限的硬件性能下滿(mǎn)足對(duì)行人與車(chē)輛的實(shí)時(shí)監(jiān)測(cè)要求。

我們還在更復(fù)雜的道路環(huán)境下測(cè)試了檢測(cè)算法。上圖是一個(gè)人車(chē)混行的道路環(huán)境,難點(diǎn)一主要在于大量汽車(chē)造成的遮擋問(wèn)題,難點(diǎn)二主要在于身著各色服飾的群眾,這種道路環(huán)境無(wú)論是對(duì)人還是對(duì)車(chē)輛的檢測(cè)而言都是一個(gè)非常大的挑戰(zhàn)。當(dāng)然在如此復(fù)雜的環(huán)境下我們現(xiàn)有的算法仍會(huì)出現(xiàn)一些錯(cuò)誤,這還需要我們積累更多的數(shù)據(jù)與改進(jìn)方案以實(shí)現(xiàn)進(jìn)一步的提升,讓我們的自動(dòng)駕駛系統(tǒng)能夠通過(guò)視覺(jué)層面上的識(shí)別保證在如此復(fù)雜人車(chē)混行道路環(huán)境下駕駛過(guò)程的安全性。

4.3 紅綠燈識(shí)別

視覺(jué)識(shí)別還可幫助我們識(shí)別紅綠燈的狀態(tài),同樣是一個(gè)比較標(biāo)準(zhǔn)的物體檢測(cè)問(wèn)題。但紅綠燈檢測(cè)與之前提到的行人與車(chē)輛檢測(cè)相比,困難之處在于紅綠燈在圖像中是一個(gè)非常小的物體,越小的物體檢測(cè)難度越大。為了解決此問(wèn)題我們提高了標(biāo)準(zhǔn)檢測(cè)方法輸出的圖像分辨率,提升最后一層深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)細(xì)小的物體的檢測(cè)敏感度。

這樣便可幫助我們對(duì)紅綠燈等小物體實(shí)現(xiàn)更準(zhǔn)確的檢測(cè)。上圖是我們?cè)谖宓揽诟浇粋€(gè)道路環(huán)境比較復(fù)雜的路段測(cè)試紅綠燈檢測(cè)算法的準(zhǔn)確性,可以看到雖然這段路上有很多紅綠燈,但基本上大部分的紅綠燈都可以被準(zhǔn)確檢測(cè)到。當(dāng)然紅綠燈不一定需要通過(guò)視覺(jué)識(shí)別進(jìn)行檢測(cè),有時(shí)我們可以結(jié)合一些地圖信息進(jìn)一步提高紅綠燈檢測(cè)結(jié)果的準(zhǔn)確性,盡可能降低依賴(lài)純視覺(jué)圖像信息進(jìn)行紅綠燈檢測(cè)時(shí)出現(xiàn)錯(cuò)誤的概率。

4.4 可行駛區(qū)域識(shí)別

對(duì)自動(dòng)駕駛系統(tǒng)而言最后一個(gè)關(guān)鍵問(wèn)題是明確汽車(chē)的可行駛區(qū)域。所謂可行使區(qū)域就是理論上路面沒(méi)有障礙物,允許汽車(chē)安全通過(guò)的區(qū)域,那么確定汽車(chē)可行駛區(qū)域的關(guān)鍵點(diǎn)就是確定路面上的障礙物,那么如何識(shí)別道路上的障礙物呢?障礙物的種類(lèi)有很多,故我們通過(guò)另一種思路來(lái)解決這個(gè)問(wèn)題,也就是對(duì)可行使區(qū)域進(jìn)行分割,這就使命題變?yōu)橐粋€(gè)比較標(biāo)準(zhǔn)的圖像語(yǔ)義分割問(wèn)題。上圖是我們?cè)诒本┪瀛h(huán)路上進(jìn)行的測(cè)試,可以看到道路中的紫色部分為可行駛區(qū)域。

在這種封閉環(huán)路上測(cè)試此技術(shù)的效果往往是比較穩(wěn)定的,但距離將其推廣并應(yīng)用于類(lèi)似人車(chē)混行等復(fù)雜道路環(huán)境還很遠(yuǎn),需要積累更多數(shù)據(jù)才能進(jìn)一步提高精度滿(mǎn)足道路安全駕駛的需求。同時(shí)除了識(shí)別可行使區(qū)域,大家可以看到圖像中的高亮部分展示的是車(chē)道線、交通標(biāo)識(shí)等必要的目標(biāo)識(shí)別。這些識(shí)別在為自動(dòng)駕駛安全穩(wěn)定運(yùn)行提供必要的駕駛輔助信息的同時(shí)也為深度學(xué)習(xí)在準(zhǔn)確預(yù)測(cè)可行使區(qū)域和監(jiān)測(cè)車(chē)輛行人等方面提供了必要的參考數(shù)據(jù)。

這便意味著這樣一個(gè)多任務(wù)網(wǎng)絡(luò)需要利用有限的計(jì)算資源更加迅速地完成多個(gè)駕駛行為監(jiān)測(cè)任務(wù),從而在出現(xiàn)行駛突發(fā)狀況時(shí)更快作出反應(yīng)與干預(yù),保證人車(chē)安全。而在深度學(xué)習(xí)領(lǐng)域,同時(shí)訓(xùn)練兩個(gè)任務(wù)相對(duì)于單獨(dú)訓(xùn)練一個(gè)任務(wù)所達(dá)成的效果更好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    4946

    瀏覽量

    97575
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48589

    瀏覽量

    245883
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14173

    瀏覽量

    169223

原文標(biāo)題:隱藏在攝像頭里的AI

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌推出用于自拍攝像頭的防臉部失真算法

    人工智能領(lǐng)域,雖然今年在市場(chǎng)落地方面中外企業(yè)進(jìn)步不同,但是谷歌、微軟等巨頭在具體算法研究上依然處于領(lǐng)先地位。谷歌研究人員成功開(kāi)發(fā)了用于自拍攝像頭的防臉部失真算法,這項(xiàng)
    發(fā)表于 06-18 08:54 ?879次閱讀

    蘋(píng)果變了,竟然允許對(duì)外公布人工智能研究成果

    12月7日消息,據(jù)國(guó)外媒體報(bào)道,保密文化傳統(tǒng)濃厚的蘋(píng)果開(kāi)始作出了改變,將對(duì)外公布在人工智能方面的研究成果,并參加人工智能方面的學(xué)術(shù)活動(dòng)。
    發(fā)表于 12-07 19:22 ?606次閱讀

    百度人工智能大神離職,人工智能的出路在哪?

    識(shí)別等技術(shù),真正的人工智能離我我們很近,不是你講一些大家都聽(tīng)不懂,用不到的技術(shù),而是可以腳踏實(shí)地的提供優(yōu)質(zhì)的服務(wù),這才是人工智能真正的出路!最后,將相關(guān)資料分享給大家,大家有什么不同的觀點(diǎn),歡迎大家一起
    發(fā)表于 03-23 17:00

    人工智能就業(yè)前景

    越大薪酬越高的現(xiàn)象。人工智能目前是一個(gè)快速增長(zhǎng)的領(lǐng)域,人才需求量大,相比于其他技術(shù)崗位,競(jìng)爭(zhēng)度偏低,薪資相對(duì)較高,因此,現(xiàn)在是進(jìn)入人工智能領(lǐng)域的大好時(shí)機(jī)。研究還表明,掌握三種以上技能的人
    發(fā)表于 03-29 15:46

    人工智能的影響超乎你想象

    ,提高收益,降低企業(yè)成本等需求。因此,制造業(yè)既是人工智能可以大有作為的領(lǐng)域,也是中國(guó)發(fā)展人工智能的優(yōu)勢(shì)領(lǐng)域。是中國(guó)引領(lǐng)全球巨大機(jī)遇除此之外,中國(guó)在人工智能領(lǐng)域的人才儲(chǔ)備、
    發(fā)表于 06-22 14:40

    解讀人工智能的未來(lái)

    `已歷經(jīng)60多年的人工智能在物聯(lián)網(wǎng)以及大數(shù)據(jù)的推動(dòng)下,實(shí)現(xiàn)飛躍式的發(fā)展,并且迎來(lái)了第三個(gè)黃金周期。必優(yōu)傳感今天和大家解讀一下關(guān)于人工智能的未來(lái)。自從有了人工智能,引發(fā)了人類(lèi)的各種“未來(lái)論”。有人說(shuō)
    發(fā)表于 11-14 10:43

    人工智能醫(yī)生未來(lái)或上線,人工智能醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)

    +醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)   由廣州市婦女兒童醫(yī)療中心教授夏慧敏、加州大學(xué)圣地亞哥分校教授張康等專(zhuān)家領(lǐng)銜的醫(yī)療數(shù)據(jù)智能化應(yīng)用團(tuán)隊(duì),聯(lián)合人工智能研究和轉(zhuǎn)化機(jī)構(gòu)研發(fā)出“輔診熊”人工智能診斷
    發(fā)表于 02-24 09:29

    【HarmonyOS HiSpark AI Camera】智能小車(chē)+智能攝像頭

    借此機(jī)會(huì)熟悉HarmonyOS。項(xiàng)目計(jì)劃①目前智能小車(chē)套件,先從裸機(jī)去實(shí)現(xiàn)一個(gè)智能小車(chē)。②通過(guò)學(xué)習(xí)HarmonyOS, 移植鴻蒙系統(tǒng)。③熟悉鴻蒙系統(tǒng)下驅(qū)動(dòng)開(kāi)發(fā)。④最后嘗試基于該開(kāi)發(fā)板以及攝像頭做個(gè)項(xiàng)目⑤項(xiàng)目調(diào)試,優(yōu)化,分享。預(yù)計(jì)
    發(fā)表于 10-29 14:40

    基于Movidius Myriad 2的人臉識(shí)別攝像頭解決方案

    2019年9月10日,致力于亞太地區(qū)市場(chǎng)的領(lǐng)先半導(dǎo)體元器件分銷(xiāo)商---大聯(lián)大控股宣布,其旗下世平推出基于英特爾(Intel)Movidius Myriad 2(MA2450)的38*38 mm2人工智能之人臉識(shí)別攝像頭解決方案。
    發(fā)表于 11-23 06:33

    路徑規(guī)劃用到的人工智能技術(shù)

    路徑規(guī)劃用到的人工智能技術(shù)二 人工智能編程語(yǔ)言/數(shù)據(jù)結(jié)構(gòu)與算法三 人工智能基礎(chǔ)原理四 智能信息獲取(簡(jiǎn)稱(chēng)爬蟲(chóng)) 與數(shù)據(jù)分析1、發(fā)起請(qǐng)求3、解析內(nèi)容4、保存數(shù)據(jù)二、Requests庫(kù)介紹
    發(fā)表于 07-20 06:53

    人工智能分類(lèi)垃圾桶原理

    的pytorch深度學(xué)習(xí)框架來(lái)實(shí)現(xiàn)全自動(dòng)垃圾分類(lèi)。Introduction本項(xiàng)目是基于YOLOv3的5G嵌入式智能分類(lèi)垃圾桶系統(tǒng)。該垃圾桶圖像處理具有兩個(gè)接口選項(xiàng),可以通過(guò)連接本地USB攝像頭獲取圖像,也可以通過(guò)5G網(wǎng)絡(luò)獲取網(wǎng)絡(luò)攝像頭
    發(fā)表于 07-21 07:48

    人工智能芯片是人工智能發(fā)展的

    人工智能芯片是人工智能發(fā)展的 | 特倫斯謝諾夫斯基責(zé)編 | 屠敏本文內(nèi)容經(jīng)授權(quán)摘自《深度學(xué)習(xí) 智能時(shí)代的核心驅(qū)動(dòng)力量》從AlphaGo的人機(jī)對(duì)戰(zhàn),到無(wú)人駕駛汽車(chē)的上路,再到AI合成主播
    發(fā)表于 07-27 07:02

    物聯(lián)網(wǎng)人工智能是什么?

    人工智能屬于計(jì)算機(jī)學(xué)科的分支,所有說(shuō)想要學(xué)習(xí)好人工智能首先要把電子信息類(lèi)和計(jì)算機(jī)類(lèi)相關(guān)專(zhuān)業(yè)學(xué)好:電子信息工程,電子科學(xué)技術(shù),通信工程,軟件工程,計(jì)算機(jī)科學(xué)與技術(shù),智能科學(xué)與技術(shù)
    發(fā)表于 09-09 14:12

    重塑未來(lái)地圖行業(yè)的秘密武器:攝像頭+人工智能

    在《先別爭(zhēng)吵人工智能的未來(lái)了,有人已經(jīng)用它在修路了》文章中,我介紹了 Roadbotics 公司如何用手機(jī)攝像頭+人工智能算法提升修路效率。
    發(fā)表于 08-24 11:27 ?4次下載

    dfrobotHUSKYLENS 人工智能攝像頭簡(jiǎn)介

    簡(jiǎn)單易用的人工智能攝像頭(人臉識(shí)別、顏色識(shí)別、標(biāo)簽/二維碼識(shí)別、物體識(shí)別、巡線、物體追蹤)-預(yù)售 簡(jiǎn)介 HuskyLens是一款簡(jiǎn)單易用的人工智能攝像頭(視覺(jué)傳感器),內(nèi)置6種功能:人
    的頭像 發(fā)表于 01-07 08:53 ?4142次閱讀
    dfrobotHUSKYLENS <b class='flag-5'>人工智能</b><b class='flag-5'>攝像頭</b>簡(jiǎn)介
    主站蜘蛛池模板: 超级淫小黄文大全很污的那种 | 亚洲午夜久久久 | 高清xxx | 看全色黄大色大片免费久久怂 | 中文字幕在线一区二区在线 | 噜噜噜噜噜久久久久久91 | 成人午夜网址 | 五月天免费在线播放 | 99se亚洲综合色区 | 97av免费视频 | 免费一级黄色录像 | 二区久久国产乱子伦免费精品 | 色老头永久免费网站 | 亚洲国产成人久久精品图片 | 欧美成人免费大片888 | 五月婷婷俺也去开心 | 黄色在线观看视频网站 | 年轻的护士3 | 加勒比色 | 中文字幕网资源站永久资源 | 欧美三级免费网站 | bt天堂资源 | 黄色国产在线视频 | 玖玖激情 | 日韩精品一区二区三区毛片 | 黄色激情小说视频 | 手机在线一区二区三区 | 日本最新免费网站 | 天天做天天添婷婷我也去 | 韩彩英三级无删版甜性涩爱 | 91噜噜噜 | 天堂网av2014| 夜夜爽影院 | 99成人国产精品视频 | 免费 在线观看 视频 | 成人亚洲网站www在线观看 | 色婷婷99综合久久久精品 | 国产亚洲婷婷香蕉久久精品 | 狠狠躁夜夜躁人人躁婷婷视频 | 免费看真人a一级毛片 | 综合五月激情 |