卷積神經網絡(Convolutional Neural Networks,
CNN)是一類包含卷積計算且具有深度結構的前饋神經網絡(Feedforward Neural Networks),是深度學習(deeplearning)的代表算法之一 ,卷積神經網絡具有表征學習(representation
learning)能力,能夠按其階層結構對輸入信息進行平移不變分類(shift-invariant
classification),因此也被稱為“平移不變人工神經網絡(Shift-Invariant Artificial Neural Networks,
SIANN)”
對卷積神經網絡的研究始于二十世紀80至90年代,時間延遲網絡和LeNet-5是最早出現的卷積神經網絡。在二十一世紀后,隨著深度學習理論的提出和數值計算設備的改進,卷積神經網絡得到了快速發展,并被應用于計算機視覺、自然語言處理等領域。
卷積神經網絡仿造生物的視知覺(visualperception)機制構建,可以進行監督學習和非監督學習,其隱含層內的卷積核參數共享和層間連接的稀疏性使得卷積神經網絡能夠以較小的計算量對格點化(grid-liketopology)特征,例如像素和音頻進行學習、有穩定的效果且對數據沒有額外的特征工程(feature engineering)要求。
卷積神經網絡的輸入層可以處理多維數據,常見地,一維卷積神經網絡的輸入層接收一維或二維數組,其中一維數組通常為時間或頻譜采樣;二維數組可能包含多個通道;二維卷積神經網絡的輸入層接收二維或三維數組;三維卷積神經網絡的輸入層接收四維數組。由于卷積神經網絡在計算機視覺領域應用較廣,因此許多研究在介紹其結構時預先假設了三維輸入數據,即平面上的二維像素點和RGB通道。
與其它神經網絡算法類似,由于使用梯度下降算法進行學習,卷積神經網絡的輸入特征需要進行標準化處理。具體地,在將學習數據輸入卷積神經網絡前,需在通道或時間/頻率維對輸入數據進行歸一化,若輸入數據為像素,也可將分布于的原始像素值歸一化至區間,輸入特征的標準化有利于提升卷積神經網絡的學習效率和表現
-
計算機視覺
+關注
關注
8文章
1704瀏覽量
46426 -
數組
+關注
關注
1文章
419瀏覽量
26259 -
深度學習
+關注
關注
73文章
5540瀏覽量
122222 -
卷積神經網絡
+關注
關注
4文章
368瀏覽量
12102
發布評論請先 登錄
相關推薦
評論