如何利用CNN實現圖像識別的任務
輸入層讀入經過規則化(統一大小)的圖像,每一層的每個神經元將前一層的一組小的局部近鄰的單元作為輸入,也就是局部感受野和權值共享,神經元抽取一些基本的視覺特征,比如邊緣、角點等,這些特征之后會被更高層的神經元所使用。卷積神經網絡通過卷積操作獲得特征圖,每個位置,來自不同特征圖的單元得到各自不同類型的特征。一個卷積層中通常包含多個具有不同權值向量的特征圖,使得能夠保留圖像更豐富的特征。卷積層后邊會連接池化層進行降采樣操作,一方面可以降低圖像的分辨率,減少參數量,另一方面可以獲得平移和形變的魯棒性。卷積層和池化層的交替分布,使得特征圖的數目逐步增多,而且分辨率逐漸降低,是一個雙金字塔結構。
CNN的特征
1)具有一些傳統技術所沒有的優點:良好的容錯能力、并行處理能力和自學習能力,可處理環境信息復雜,背景知識不清楚,推理規則不明確情況下的問題,允許樣品有較大的缺損、畸變,運行速度快,自適應性能好,具有較高的分辨率。它是通過結構重組和減少權值將特征抽取功能融合進多層感知器,省略識別前復雜的圖像特征抽取過程。
2)泛化能力要顯著優于其它方法,卷積神經網絡已被應用于模式分類,物體檢測和物體識別等方面。利用卷積神經網絡建立模式分類器,將卷積神經網絡作為通用的模式分類器,直接用于灰度圖像。
3)是一個前潰式神經網絡,能從一個二維圖像中提取其拓撲結構,采用反向傳播算法來優化網絡結構,求解網絡中的未知參數。
4)一類特別設計用來處理二維數據的多層神經網絡。CNN被認為是第一個真正成功的采用多層層次結構網絡的具有魯棒性的深度學習方法。CNN通過挖掘數據中的空間上的相關性,來減少網絡中的可訓練參數的數量,達到改進前向傳播網絡的反向傳播算法效率,因為CNN需要非常少的數據預處理工作,所以也被認為是一種深度學習的方法。在CNN中,圖像中的小塊區域(也叫做“局部感知區域”)被當做層次結構中的底層的輸入數據,信息通過前向傳播經過網絡中的各個層,在每一層中都由過濾器構成,以便能夠獲得觀測數據的一些顯著特征。因為局部感知區域能夠獲得一些基礎的特征,比如圖像中的邊界和角落等,這種方法能夠提供一定程度對位移、拉伸和旋轉的相對不變性。
5)CNN中層次之間的緊密聯系和空間信息使得其特別適用于圖像的處理和理解,并且能夠自動的從圖像抽取出豐富的相關特性。
6)CNN通過結合局部感知區域、共享權重、空間或者時間上的降采樣來充分利用數據本身包含的局部性等特征,優化網絡結構,并且保證一定程度上的位移和變形的不變性。
7)CNN是一種深度的監督學習下的機器學習模型,具有極強的適應性,善于挖掘數據局部特征,提取全局訓練特征和分類,它的權值共享結構網絡使之更類似于生物神經網絡,在模式識別各個領域都取得了很好的成果。
8) CNN可以用來識別位移、縮放及其它形式扭曲不變性的二維或三維圖像。CNN的特征提取層參數是通過訓練數據學習得到的,所以其避免了人工特征提取,而是從訓練數據中進行學習;其次同一特征圖的神經元共享權值,減少了網絡參數,這也是卷積網絡相對于全連接網絡的一大優勢。共享局部權值這一特殊結構更接近于真實的生物神經網絡使CNN在圖像處理、語音識別領域有著獨特的優越性,另一方面權值共享同時降低了網絡的復雜性,且多維輸入信號(語音、圖像)可以直接輸入網絡的特點避免了特征提取和分類過程中數據重排的過程。
9)CNN的分類模型與傳統模型的不同點在于其可以直接將一幅二維圖像輸入模型中,接著在輸出端即給出分類結果。其優勢在于不需復雜的預處理,將特征抽取,模式分類完全放入一個黑匣子中,通過不斷的優化來獲得網絡所需參數,在輸出層給出所需分類,網絡核心就是網絡的結構設計與網絡的求解。這種求解結構比以往多種算法性能更高。
10)隱層的參數個數和隱層的神經元個數無關,只和濾波器的大小和濾波器種類的多少有關。隱層的神經元個數,它和原圖像,也就是輸入的大小(神經元個數)、濾波器的大小和濾波器在圖像中的滑動步長都有關。
-
神經網絡
+關注
關注
42文章
4783瀏覽量
101236 -
卷積
+關注
關注
0文章
95瀏覽量
18550 -
cnn
+關注
關注
3文章
353瀏覽量
22354
發布評論請先 登錄
相關推薦
評論