資料介紹
在過去幾年里,許多計算機視覺相關的深度學習的發展,都可以歸結于少數幾個神經網絡架構。拋開所有關于數學、代碼和實現的細節,來探索一個簡單的問題:這些模型如何工作以及為什么工作?
在撰寫這篇文章時,Keras 庫(http://suo.im/4aLGEd)中已經涵蓋了6種預訓練模型,分別是:
VGG16
VGG19
ResNet50
Inception v3
Xception
MobileNet
▍VGG
VGG網絡和從2012年早期的 AlexNet 網絡一樣,遵循著現有卷積網絡的典型布局:在最終的全連接分類層(fully-connected classification layers)之前,由一系列的卷積層(convolutional layers),最大池化層(max-pooling layers)和激活層(activation layers)構成。
MobileNet 本質上是 Xception 架構,針對移動應用而優化的線性版本。剩下的三種架構則真正重新定義了我們看待深度網絡的方式。
這篇文章接下來的部分將側重于ResNet,Inception和Xception三種架構的直觀理解,以及為什么它們成為計算機視覺中許多后續工作的基石。
▍ResNet
為什么深度網絡在不斷增加層的時候,表現反而變的更差?
直觀來想, 更深層次的網絡,應該不比較淺的網絡表現的差,至少在訓練的時候應該這樣(這時沒有過擬合over-fitting的風險)。
讓我們作一個思維實驗,假設我們已經建立了一個n層的網絡,達到了一定的準確性。 如果僅通過復制相同的前n個層并對最后一層執行單位映射,則n + 1層的網絡至少應該能夠獲得完全相同的精度。
類似地,n + 2,n + 3和n + 4層的網絡都可以繼續執行單位映射并獲得相同的準確性。 然而,實際上,這些更深層的網絡在性能上幾乎都會有所下降。
ResNet的作者將這些問題歸結為一個假設:直接映射難以學習。
他們提出了一個解決辦法:用學習 x到 H(x) 兩者之間的差異,或者“殘差”的方式,替代嘗試學習從x到 H(x) 的底層映射。這樣,我們就可以可以通過輸入殘差來計算 H(x) 。
假設我們用 F(x)=H(x)-x 來表示殘差。 ResNet 網絡現在不是試圖直接學習 H(x) , 而是學習 F(x)+x。
這引出了你可能知道的著名的ResNet(或“殘差網絡”)模塊:
ResNet中的每個“模塊”都由一系列層和一個“捷徑”連接,捷徑連接將模塊的輸入值直接添加到其輸出值。 “添加”操作以元素對應方式執行,如果輸入和輸出的大小不同,可以使用補零法(zero-padding)或投影(通過1x1卷積)匹配尺寸。
回到我們的思維實驗,捷徑連接大大簡化了我們對單位層的構建。 直觀的看,學習將 F(x) 推到0并將輸出值保留為x比從頭開始學習單位交換(identity transformation)要容易得多。 一般情況下,ResNet為層提供了一個“參考”點—x—來開始學習。
這個想法在實踐中效果驚人。在此之前,深度神經網絡經常遇到梯度消失(vanishing gradients)的問題,來自誤差函數的梯度信號隨著它們向較早層反向傳播而呈指數下降。
從本質上說,當誤差信號一直傳到到早期層時,它們已經小到網絡無法進行學習了。然而,由于ResNet中的梯度信號可以通過捷徑連接直接返回到早期層,突然間我們就可以建立 50層,101層,152層,甚至(想當然)1000+層的網絡,而它們仍然表現良好。用22層的網絡贏得了2014年ILSVRC挑戰,這在當時是一個巨大的技術飛躍。
- 網絡架構的時鐘系統——設計與驗證
- 改進的多尺度深度網絡手勢識別模型 8次下載
- 基于深度級聯孿生網絡的通信信號調制識別算法 33次下載
- 采用自監督CNN進行單圖像深度估計的方法 13次下載
- 深度:嵌入式系統的軟件架構設計!資料下載
- 基于預訓練模型和長短期記憶網絡的深度學習模型 19次下載
- 3小時學習神經網絡與深度學習課件下載 0次下載
- 結合注意力機制的改進深度學習光流網絡 4次下載
- 基于深度神經網絡的圖像語義分割方法 11次下載
- 基于深度信念網絡的實體識別算法 16次下載
- 綜述深度神經網絡的解釋方法及發展趨勢 19次下載
- 一種基于多視圖架構的深度卷積神經網絡模型 5次下載
- 一種多層級特征融合就的深度卷積網絡 7次下載
- 基于深度神經網絡的文本分類分析 37次下載
- deepid3:非常深的神經網絡的人臉識別深度算法的網絡架構 25次下載
- 殘差網絡是深度神經網絡嗎 1150次閱讀
- 深度神經網絡(DNN)架構解析與優化策略 2064次閱讀
- 神經網絡架構有哪些 809次閱讀
- 詳解深度學習、神經網絡與卷積神經網絡的應用 2239次閱讀
- 深度ReLU網絡的對應淺層網絡 582次閱讀
- 神經網絡的DBN與GAN及RNN等形象的詳細資料講解 5068次閱讀
- 深度神經網絡的實現機理與決策邏輯難以理解 2992次閱讀
- 數據集,網絡架構和剪枝方法 5948次閱讀
- 淺析深度學習的原理及其架構 6517次閱讀
- 如何理解深度學習?深度學習的理論探索分析 3706次閱讀
- 基于Unrolling的深度方法及應用 5147次閱讀
- 采用的網絡架構,實現了基于圖像強度的變分深度自編碼器 6256次閱讀
- 百度發布Visual DL 使得深度學習任務變得生動形象,實現可視分析 4897次閱讀
- 斯坦福探索深度神經網絡可解釋性 決策樹是關鍵 4401次閱讀
- 詳細剖析神經網絡和深度神經網絡的區別 3.2w次閱讀
下載排行
本周
- 1涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 76次下載 | 1 積分
- 2錦銳科技CA51F2 SDK開發包
- 24.06 MB | 29次下載 | 1 積分
- 3錦銳CA51F005 SDK開發包
- 19.47 MB | 3次下載 | 1 積分
- 4蘋果iphone 11電路原理圖
- 4.98 MB | 3次下載 | 2 積分
- 5基礎模擬電子電路
- 3.80 MB | 3次下載 | 1 積分
- 6RA-Eco-RA6M4-100PIN-V1.0開發板資料
- 34.89 MB | 1次下載 | 免費
- 7STM32F3系列、STM32F4系列、STM32L4系列和STM32L4+系列Cortex-M4編程手冊
- 3.32 MB | 1次下載 | 免費
- 8聯想A820t手機維修圖紙包括主板原理圖 尾板原理圖 點位圖
- 0.62 MB | 次下載 | 5 積分
本月
- 1AI智能眼鏡產業鏈分析
- 4.43 MB | 383次下載 | 免費
- 2蘇泊爾電磁爐線路的電路原理圖資料合集
- 2.02 MB | 296次下載 | 5 積分
- 3貼片三極管上的印字與真實名稱的對照表詳細說明
- 0.50 MB | 94次下載 | 1 積分
- 4長虹液晶電視R-HS310B-5HF01的電源板電路原理圖
- 0.46 MB | 91次下載 | 5 積分
- 5涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 76次下載 | 1 積分
- 6錦銳科技CA51F2 SDK開發包
- 24.06 MB | 29次下載 | 1 積分
- 7AO4803A雙P通道增強型場效應晶體管的數據手冊
- 0.11 MB | 28次下載 | 2 積分
- 8長虹液晶彩電LS29機芯的技術資料說明
- 3.42 MB | 16次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191388次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81588次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論