當(dāng)你使用支付寶“刷臉支付”時(shí),你是否好奇過你的手機(jī)是如何認(rèn)出你的?這得益于計(jì)算機(jī)視覺的蓬勃發(fā)展。計(jì)算機(jī)視覺是一門教計(jì)算機(jī)如何“看”世界的學(xué)科。計(jì)算機(jī)視覺包含多個(gè)分支,其中圖像分類、目標(biāo)檢測、圖像分割、目標(biāo)跟蹤等是計(jì)算機(jī)視覺領(lǐng)域最重要的研究課題。本文將介紹目標(biāo)檢測的相關(guān)知識,并提供一些有趣的實(shí)例幫助理解。
一、什么是目標(biāo)檢測
目標(biāo)檢測,用通俗的語言來講,就是通過編寫程序,讓計(jì)算機(jī)從一張圖片中找出感興趣的目標(biāo),并確定它們的位置和類別的方法。目標(biāo)檢測包含兩個(gè)任務(wù):(1)判定圖像上有哪些目標(biāo)物體,將它們進(jìn)行分類。(2)判定圖像中目標(biāo)物體在哪里,并確定它們的準(zhǔn)確位置。如圖1-1所示,目標(biāo)檢測算法關(guān)注的是“貓”這一特定目標(biāo)物體,圖像中不但檢測出了一只貓,還準(zhǔn)確地框出了這只貓?jiān)趫D像中的位置。
二、目標(biāo)檢測中的核心問題
目標(biāo)檢測共有以下四個(gè)核心問題:(1)目標(biāo)可能出現(xiàn)在圖像的任何位置;(2)目標(biāo)有各種不同的大小;(3)目標(biāo)有各種不同的形狀;(4)光照、遮擋等因素的干擾。如圖2-1所示,在這幅圖中,人臉被口罩所遮擋。
三、目標(biāo)檢測算法簡介
首先我們來介紹深度學(xué)習(xí)方法。簡單來說,深度學(xué)習(xí)就是把計(jì)算機(jī)要學(xué)習(xí)的東西看成一大堆數(shù)據(jù),把這些數(shù)據(jù)丟進(jìn)一個(gè)復(fù)雜的、包含多個(gè)層級的數(shù)據(jù)處理網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò)),然后檢查經(jīng)過這個(gè)網(wǎng)絡(luò)處理得到的結(jié)果是否符合要求——如果符合,就保留這個(gè)網(wǎng)絡(luò)作為目標(biāo)模型,如果不符合,就一次次地、鍥而不舍地調(diào)整網(wǎng)絡(luò)的參數(shù)設(shè)置,直到輸出滿足要求為止。
圖3-1 深度學(xué)習(xí)體系[1]
隨著深度學(xué)習(xí)的發(fā)展,目標(biāo)檢測領(lǐng)域也開始使用深度學(xué)習(xí)方法。基于深度學(xué)習(xí)的目標(biāo)檢測方法總共分為兩類:一階段目標(biāo)檢測算法和兩階段目標(biāo)檢測算法,如圖所示。
圖3-2 目標(biāo)檢測算法分類
一階段目標(biāo)檢測算法可以實(shí)時(shí)檢測,不需要產(chǎn)生候選區(qū)域,可以直接輸出目標(biāo)的位置和類別。最具代表性的一階段目標(biāo)檢測算法有YOLO系列算法。
YOLOv1(You only look once)算法在2016年首次提出,YOLOv1算法只進(jìn)行一次預(yù)測,卻能直接輸出目標(biāo)的位置和類別,比其他基于深度學(xué)習(xí)的目標(biāo)檢測方法速度更快,缺陷在于準(zhǔn)確度不算很高。后續(xù)提出的YOLOv2與YOLOv3在YOLOv1基礎(chǔ)上做了很大的改進(jìn),提升了目標(biāo)檢測的準(zhǔn)確度,YOLO系列算法在多個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。圖3-3是使用YOLO系列算法進(jìn)行目標(biāo)檢測的一個(gè)實(shí)例,僅僅使用了一個(gè)非常簡單的卷積網(wǎng)絡(luò),就可以同時(shí)標(biāo)出目標(biāo)的位置和所屬類別的可能性大小。
圖3-30YOLO算法檢測系統(tǒng)[2]
兩階段目標(biāo)檢測算法將目標(biāo)檢測分為兩個(gè)階段:首先對原圖進(jìn)行處理,產(chǎn)生較多的候選框,在各個(gè)候選框內(nèi)尋找目標(biāo)的位置并分類。這種方法精度較高,但是速度較慢,不能實(shí)現(xiàn)實(shí)時(shí)目標(biāo)檢測。最具代表性的兩階段目標(biāo)檢測方法是R-CNN, Fast-RCNN,Faster-RCNN, FPN等。圖3-4是兩階段目標(biāo)檢測算法R-CNN的檢測系統(tǒng)圖,它先在圖像上產(chǎn)生大于2000個(gè)候選框,再通過一個(gè)卷積網(wǎng)絡(luò),最后得到目標(biāo)的精確位置和目標(biāo)的類別。
圖3-4 R-CNN算法檢測系統(tǒng)[3]
綜上,一階段目標(biāo)檢測算法適合對實(shí)時(shí)性要求較高、但對精度無過高要求的應(yīng)用場景,而二階段目標(biāo)檢測算法與此相反,適合對精度有較高要求,但不要求實(shí)時(shí)檢測的應(yīng)用場景。隨著技術(shù)的發(fā)展,二階段目標(biāo)檢測算法也越來越追求速度與精度的平衡。
?+
+
四、目標(biāo)檢測的應(yīng)用場景
目標(biāo)檢測是計(jì)算機(jī)視覺最基本的問題之一,具有極為廣泛的應(yīng)用,下面簡單介紹三種典型的應(yīng)用場景,分別是人臉識別、智能交通和工業(yè)檢測。
1.人臉識別
使用支付寶進(jìn)行“刷臉支付”就是一種典型的人臉識別技術(shù)。人臉識別是基于人的面部特征進(jìn)行身份識別的一種生物識別技術(shù),通過采集含有人臉的圖像或視頻,對檢測到的人臉進(jìn)行識別。圖是使用支付寶進(jìn)行“刷臉支付”的示意圖。
圖4-1 刷臉支付示意圖
人臉識別系統(tǒng)主要包括四個(gè)部分,分別為人臉圖像檢測、人臉圖像預(yù)處理、人臉圖像特征提取以及身份匹配與識別,流程如圖所示。其中人臉圖像檢測是進(jìn)行后續(xù)識別的基礎(chǔ),這就是目標(biāo)檢測在人臉識別中的應(yīng)用。
圖4-2人臉識別系統(tǒng)流程圖
近年來,人臉識別技術(shù)已經(jīng)取得了長足的發(fā)展,目前廣泛應(yīng)用于公安、交通、支付等多個(gè)實(shí)際場景。
2. 智能交通
自動(dòng)駕駛技術(shù)是一種廣為人知的智能交通應(yīng)用。如圖所示,自動(dòng)駕駛技術(shù)中的目標(biāo)檢測主要包含對道路、車輛以及行人的檢測,對交通標(biāo)志物以及路旁物體的檢測識別。主流的人工智能公司,如百度、華為、大疆等,都很重視自動(dòng)駕駛方面的研發(fā),目前已經(jīng)初步實(shí)現(xiàn)了受限路況條件下的自動(dòng)駕駛,但距離實(shí)現(xiàn)不受路況、天氣等因素影響的自動(dòng)駕駛(L4級別),還有相當(dāng)長的一段距離。
圖4-3 目標(biāo)檢測在自動(dòng)駕駛中的應(yīng)用
除了自動(dòng)駕駛技術(shù),目標(biāo)檢測也可以幫助解決道路擁堵問題。通過目標(biāo)檢測算法,對道路上的相機(jī)采集的視頻圖像進(jìn)行分析,根據(jù)相應(yīng)路段的車流量調(diào)整紅綠燈的時(shí)間,可以避免大規(guī)模的擁堵。
目標(biāo)檢測也可以幫助公安部門追蹤嫌疑人或嫌疑車輛。如圖,通過目標(biāo)檢測算法,鎖定嫌疑車輛的特征,可對他們進(jìn)行全程軌跡追蹤。
圖4-4 目標(biāo)檢測在公安偵察方面的應(yīng)用[6]
從根本上看,交通場景中各種具體應(yīng)用的底層實(shí)現(xiàn),都是以目標(biāo)檢測技術(shù)為基礎(chǔ)的。
3.工業(yè)檢測
在產(chǎn)品的生產(chǎn)過程中,由于原料、制造業(yè)工藝、環(huán)境等因素的影響,產(chǎn)品有可能產(chǎn)生各種各樣的問題。其中一部分是外觀缺陷,即人眼可識別的缺陷。在傳統(tǒng)生產(chǎn)流程中,外觀缺陷大多采用人工檢測的方式進(jìn)行識別,不僅消耗人力成本,也無法保障檢測效果。圖4-5是利用YOLO算法對電路板外觀缺陷進(jìn)行檢測的示意圖,利用目標(biāo)檢測算法,可以準(zhǔn)確地鎖定 哪里產(chǎn)生了缺陷,產(chǎn)生了什么缺陷。
圖4-5 YOLO算法檢測電路板的外觀缺陷[7]
工業(yè)檢測利用計(jì)算機(jī)視覺技術(shù)中的目標(biāo)檢測算法,把產(chǎn)品在生產(chǎn)過程中出現(xiàn)的裂紋、形變、部件丟失等外觀缺陷檢測出來,可以提升工廠的生產(chǎn)效率。
-
程序
+關(guān)注
關(guān)注
117文章
3796瀏覽量
81418 -
目標(biāo)檢測
+關(guān)注
關(guān)注
0文章
211瀏覽量
15664 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46130
原文標(biāo)題:計(jì)算機(jī)如何“看”世界——目標(biāo)檢測簡介及應(yīng)用
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論