在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

卷積神經網絡的問題及其解決方案CoordConv

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-17 09:45 ? 次閱讀

Uber近日一篇論文引起許多討論:該論文稱發現卷積神經網絡一個引人注目的“失敗”,并提出解決方案CoordConv。論文稱CoordConv解決了坐標變換問題,具有更好的泛化能力,訓練速度提高150倍,參數比卷積少10-100倍。當然,這是在極大的計算力(100個GPU)的基礎上進行的。這真的是重要的結果嗎?計算機視覺領域專家Filip Piekniewski對此提出質疑。

我讀了很多深度學習論文,通常每周都會閱讀幾篇。我讀過的論文可能已經有上千篇。我發現,機器學習或深度學習方面的論文普遍存在的問題是,它們通常處于科學和工程之間的某個無人區,我稱之為“學術工程”(academic engineering)。我對其描述為:

以我個人的淺見而言,一篇科學論文應該傳達一種有能力解釋某事的idea。例如,一篇證明數學定理的論文,一篇提出某種物理現象模型的論文。或者,一篇科學論文可以是實驗性的,實驗的結果告訴我們一些關于現實的基本知識。盡管如此,科學論文的核心思想是對一些非平凡的普遍性(和預測力)或對現實本質的一些非平凡的觀察的相對簡潔的表述。

一篇工程論文應該介紹一種解決特定問題的方法。問題可能會因應用而異,有時它們可能非常無趣而具體,但對某個領域的人來說卻是有用的。對于一篇工程論文來說,與科學論文不同的是:解決方案的普遍性可能不是最重要的。重要的是解決方案能夠有效地實施,例如,給定可用的組件,能比其他解決方案更便宜或更節能,等等。工程論文的核心思想是應用,其余的僅僅是解決應用問題的想法的集合。

機器學習介于兩者之間。機器學習領域既有一些明顯的科學論文(例如提出反向傳播backprop的論文),也有一些明顯的工程論文的例子,例如描述一個非常特殊的實際問題的解決方案。但機器學習中大多數論文似乎都是工程的,只不過它們的工程是指在一個學術數據集上設計出一種綜合的測量方法。為了顯示出優勢,一些特別的技巧被從沒有人知道的地方提取出來(通常具有極其有限的普遍性),并且經過一些統計上不重要的測試后宣布該方法最優。

還有第四種論文,它確實提出一個idea。這個idea甚至可能是有用的,但它同時也是微不足道的。為了掩蓋這種尷尬的事實,“學術工程”重炮再次上膛,使得論文整體上看起來令人印象深刻。

這就是Uber人工智能實驗室(Uber AI labs)最近的一篇論文“"An Intriguing Failing of Convolutional Neural Networks and the CoordConv Solution”(卷積神經網絡的問題及其解決方案CoordConv)的情況,我將在下面詳細剖析這篇論文。

只需大約50行python代碼的事情

讓我們直接看這篇論文的內容。

這篇論文的核心論點是:卷積神經網絡在需要定位的任務上表現不太好,在這些任務中,輸出標簽或多或少是輸入實體坐標的直接函數,而不是該輸入的任何其他屬性。

卷積網絡確實不能很好地解決這個問題,因為卷積神經網絡的原始模型神經認知機(Neocognitron)的設計就是忽視位置的。接下來,作者提出了一個解決方案:在卷積層中添加坐標,作為附加的輸入映射。

卷積層和添加坐標的CoordConv層

這聽起來非常聰明,但作者實際上提出的是該領域任何一名從業者都認為是理所當然的東西——添加一個更適合解碼所需輸出的特征(feature)。任何在計算機視覺領域做實際工作的人都不會認為添加特征有什么非凡之處,盡管在深度學習圈的純粹學術爭論中這是一個激烈的話題,脫離實際應用的研究人員認為我們應該只使用學習的特征,因為這種方式更好。因此,深度學習的研究人員現在開始喜歡特性工程,雖然這也許不是壞事……

總之,他們添加了一個特性,即坐標的顯式值。然后他們創建了一個簡單的數據集(稱之為Not-so-Clevr),以測試這一想法的性能。

Not-so-Clevr數據集

那么他們的實驗是否聰明呢?讓我們看看。

論文中使用的Toy tasks

任務之一是基于坐標生成一個one-hot圖像,或者基于一個one-hot圖像生成坐標。實驗表明,將坐標添加到卷積網絡確實可以顯著提高性能。

不過如果他們不是直接跳到TensorFlow,也許這就不那么令人震驚了,他們會發現,可以明確地構建一個神經網絡來解決從one-hot到坐標的關聯問題,而無需任何訓練。對于這個任務,我會使用三個操作:卷積、非線性激活、以及求和。幸運的是,這些都是卷積神經網絡的基本組成部分:

注意:one hot像素位圖到坐標翻譯!一個卷積層,一個非線性激活,一個求和,最后一個減法。就是這樣。無需學習,只有大約50行python代碼(帶注釋)……對于這個任務,給定坐標特征是微不足道的。毫無疑問,這是可行的。到目前為止,我們所用的知識還沒有超出一個剛上完ML 101課程的學生所能解決的。所以,他們不得不使用重型火炮:GAN。

好吧,讓我們用GAN試試這個合成生成任務,一個帶有坐標特征,一個沒有。好了,現在讓我們繼續看論文……

他們在附錄的表格中給出了結果:

他們在ImageNet上嘗試了這個坐標特征,將它添加到ResNet-50網絡的第一層。我認為不會有太大的差別,因為ImageNet中的類別讀取不是位置的函數(如果存在這樣的偏差,那么在訓練期間的數據增強應該完全刪除它)。所以他們用100個GPU來訓練網絡(100個GPU!天啊!)。然而,到小數點后第4位,結果才顯示出一點差異。Facebook、谷歌的人可能會用10000個GPU來復現這個結果吧。這些GPU能不能用來做些更重要的事情?

總結

這確實是一篇吸引人的論文。它揭露了當前深度學習研究的淺薄之處,這些研究被荒謬的計算量所掩蓋了。為什么Uber AI 實驗室要做這個研究?有什么意義?我的意思是,如果這些是某個大學的某些學生做的,他們想做出點什么投給會議,那么無可厚非。但Uber AI?我以為這些人應該致力于打造自動駕駛汽車,不是嗎?不過,比這篇論文更有趣的是哪些對這個結果的無足輕重無知,而去贊美它的追隨者。請閱讀原始博客(https://eng.uber.com/coordconv)的評論,或者Twitter上的評論,贊美者甚至包括一些著名的DL研究人員。他們顯然花了很多時間盯著GPU上的進度條,才意識到他們在稱贊一些顯而易見的東西,這些顯而易見的東西可以用幾行python代碼手工構建。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4808

    瀏覽量

    102822
  • 機器學習
    +關注

    關注

    66

    文章

    8492

    瀏覽量

    134118
  • python
    +關注

    關注

    56

    文章

    4825

    瀏覽量

    86213

原文標題:【卷積神經網絡失陷】幾行Python代碼搞定,偏要用100個GPU!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    全連接神經網絡卷積神經網絡有什么區別

    全連接神經網絡卷積神經網絡的區別
    發表于 06-06 14:21

    卷積神經網絡如何使用

    卷積神經網絡(CNN)究竟是什么,鑒于神經網絡在工程上經歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發表于 07-17 07:21

    什么是圖卷積神經網絡

    卷積神經網絡
    發表于 08-20 12:05

    卷積神經網絡的優點是什么

    卷積神經網絡的優點
    發表于 05-05 18:12

    請問為什么要用卷積神經網絡

    為什么要用卷積神經網絡
    發表于 06-13 13:11

    卷積神經網絡CNN介紹

    【深度學習】卷積神經網絡CNN
    發表于 06-14 18:55

    卷積神經網絡的層級結構和常用框架

      卷積神經網絡的層級結構  卷積神經網絡的常用框架
    發表于 12-29 06:16

    卷積神經網絡一維卷積的處理過程

    。本文就以一維卷積神經網絡為例談談怎么來進一步優化卷積神經網絡使用的memory。文章(卷積神經網絡
    發表于 12-23 06:16

    卷積神經網絡模型發展及應用

    地介紹了卷積 神經網絡的發展歷史,然后分析了典型的卷積神經 網絡模型通過堆疊結構、網中網結構、殘差結構以及 注意力機制提升模型性能的方法,并
    發表于 08-02 10:39

    卷積神經網絡原理:卷積神經網絡模型和卷積神經網絡算法

    卷積神經網絡原理:卷積神經網絡模型和卷積神經網絡算法 卷積
    的頭像 發表于 08-17 16:30 ?1802次閱讀

    卷積神經網絡概述 卷積神經網絡的特點 cnn卷積神經網絡的優點

    卷積神經網絡概述 卷積神經網絡的特點 cnn卷積神經網絡的優點?
    的頭像 發表于 08-21 16:41 ?3670次閱讀

    卷積神經網絡的基本原理 卷積神經網絡發展 卷積神經網絡三大特點

    卷積神經網絡的基本原理 卷積神經網絡發展歷程 卷積神經網絡三大特點?
    的頭像 發表于 08-21 16:49 ?3021次閱讀

    卷積神經網絡層級結構 卷積神經網絡卷積層講解

    卷積神經網絡層級結構 卷積神經網絡卷積層講解 卷積神經網絡
    的頭像 發表于 08-21 16:49 ?9685次閱讀

    卷積神經網絡的介紹 什么是卷積神經網絡算法

    卷積神經網絡的介紹 什么是卷積神經網絡算法 卷積神經網絡涉及的關鍵技術
    的頭像 發表于 08-21 16:49 ?2261次閱讀

    卷積神經網絡的基本結構及其功能

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡的基
    的頭像 發表于 07-02 14:45 ?3347次閱讀
    主站蜘蛛池模板: 中国一级特黄视频 | 国产盗摄女子私密保健视频 | 二区在线播放 | 人人爽人人爱 | 菲菲国产在线观看 | 久视频在线观看久视频 | 久久三级毛片 | 精品videosex性欧美 | 天天操天天射天天爽 | 4399一级成人毛片 | 高清性色生活片久久久 | 色综合成人丁香 | 国产caoni111在线观看视频 | 狠狠五月深爱婷婷网免费 | 一级毛片视屏 | 亚洲成人伊人网 | 亚洲欧美视频 | 久久综合99| 波多野结衣久久国产精品 | 欧美色视频超清在线观看 | 农村妇女野外一级毛片 | 日本午夜影院 | 噜噜噜噜噜久久久久久91 | 免费视频18 | 极品吹潮视频大喷潮tv | 一级欧美视频 | 国产亚洲精品aa在线观看 | 激情综合婷婷丁香六月花 | 三级理论在线播放大全 | 天天成人综合网 | 久久www免费人成高清 | 久久久亚洲欧美综合 | 寄宿日记在线看 | 亚洲aⅴ久久久噜噜噜噜 | 特黄特色大片免费视频播放 | 国产综合精品久久亚洲 | 久久极品| 波多野结衣一级毛片 | 免费特黄一区二区三区视频一 | 欧美色频 | 最好看免费中文字幕2018视频 |