卷積神經(jīng)網(wǎng)絡(luò)圖像識別
在機器視覺的概念中,圖像識別是指軟件具有分辨圖片中的人物、位置、物體、動作以及筆跡的能力。計算機可以應(yīng)用機器視覺技巧,結(jié)合人工智能以及攝像機來進行圖像識別。
根據(jù)神經(jīng)網(wǎng)絡(luò)的構(gòu)建方式,一個相對簡單的改變就可以讓較大的圖像變得更好處理。改變的結(jié)果就是我們所見到的卷積神經(jīng)網(wǎng)絡(luò)(CNNs,ConvNets)。
神經(jīng)網(wǎng)絡(luò)的廣適性是他們的優(yōu)點之一,但是在處理圖像時,這個優(yōu)點就變成了負擔(dān)。卷積神經(jīng)網(wǎng)絡(luò)對此專門進行了折衷:如果一個網(wǎng)絡(luò)專為處理圖像而設(shè)計,有些廣適性需要為更可行的解決方案做出讓步。
對于任意圖像,像素之間的距離與其相似性有很強的關(guān)系,而卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計正是利用了這一特點。這意味著,對于給定圖像,兩個距離較近的像素相比于距離較遠的像素更為相似。然而,在普通的神經(jīng)網(wǎng)絡(luò)中,每個像素都和一個神經(jīng)元相連。在這種情況下,附加的計算負荷使得網(wǎng)絡(luò)不夠精確。
卷積神經(jīng)網(wǎng)絡(luò)通過消除大量類似的不重要的連接解決了這個問題。技術(shù)上來講,卷積神經(jīng)網(wǎng)絡(luò)通過對神經(jīng)元之間的連接根據(jù)相似性進行過濾,使圖像處理在計算層面可控。對于給定層,卷積神經(jīng)網(wǎng)絡(luò)不是把每個輸入與每個神經(jīng)元相連,而是專門限制了連接,這樣任意神經(jīng)元只能接受來自前一層的一小部分的輸入(例如3*3或5*5)。因此,每個神經(jīng)元只需要負責(zé)處理一張圖像的一個特定部分。(順便提一下,這基本就是人腦的獨立皮質(zhì)神經(jīng)元工作的方式。每個神經(jīng)元只對完整視野的一小部分進行響應(yīng))。
卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢
卷積神經(jīng)網(wǎng)絡(luò)是在Hub等人對貓的視覺皮層中細胞的研究基礎(chǔ)上,通過擬生物大腦皮層構(gòu)而特殊設(shè)計的含有多隱層的人工神經(jīng)網(wǎng)絡(luò)。卷積層、池化層、激活函數(shù)是卷積神經(jīng)網(wǎng)路的要組部分。卷積神經(jīng)網(wǎng)絡(luò)通過局部感受野、權(quán)重共享和降采樣3種策略,降低了網(wǎng)絡(luò)模型的復(fù)雜度,同時對于平移、旋轉(zhuǎn)、尺度縮放等形式的變有度的不變性。因此被廣泛應(yīng)用于圖像分類、目標(biāo)識別、語音識別等領(lǐng)域一般情況下,常見的卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、激活層、池化層、全連接層和最后的輸出層構(gòu)成。
卷積神經(jīng)網(wǎng)絡(luò)采用原始圖像作為輸入, 可以有效的從大量樣本中學(xué)習(xí)到相應(yīng)地特征, 避免了復(fù)雜的特征提取過程。由于卷積神經(jīng)網(wǎng)絡(luò)(CNN) 可以直接對二維圖像進行處理, 因此, 在圖像處理方面得到了廣泛的應(yīng)用, 并取得了較多的研究成果。該網(wǎng)絡(luò)通過簡單的非線性模型從原始圖像中提取出更加抽象的特征,并且在整個過程中只需少量的人工參與。
卷積神經(jīng)網(wǎng)絡(luò)具有局部感知和參數(shù)共享兩個特點,局部感知即卷積神經(jīng)網(wǎng)絡(luò)提出每個神經(jīng)元不需要感知圖像中的全部像素,只對圖像的局部像素進行感知,然后在更高層將這些局部的信息進行合并,從而得到圖像的全部表征信息。不同層的神經(jīng)單元采用局部連接的方式,即每一層的神經(jīng)單元只與前一層部分神經(jīng)單元相連。每個神經(jīng)單元只響應(yīng)感受野內(nèi)的區(qū)域,完全不關(guān)心感受野之外的區(qū)域。這樣的局部連接模式保證了學(xué)習(xí)到的卷積核對輸入的空間局部模式具有最強的響應(yīng)。權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)使之更類似于生物神經(jīng)網(wǎng)絡(luò),降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量。這種網(wǎng)絡(luò)結(jié)構(gòu)對平移、比例縮放、傾斜或者共他形式的變形具有高度不變性。而且卷積神經(jīng)網(wǎng)絡(luò)采用原始圖像作為輸入,可以有效的從大量樣本中學(xué)習(xí)到相應(yīng)地特征,避免了復(fù)雜的特征提取過程。
責(zé)任編輯:YYX
-
圖像識別
+關(guān)注
關(guān)注
9文章
526瀏覽量
39080 -
卷積神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
4文章
369瀏覽量
12287
發(fā)布評論請先 登錄
評論