在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

zhKF_jqr_AI ? 2018-02-09 14:47 ? 次閱讀

最近神經網絡的成功不斷擴展著模型的架構,并促成了架構搜索的出現,即神經網絡自動學習架構。架構搜索的傳統方法是神經演化,如今,硬件的發展能實現大規模的演變,生成可以與手工設計相媲美的圖像分類模型。但是,新的技術雖然可行,卻無法讓開發者決定在具體的環境下(即搜索空間和數據集)使用哪種方法。

在本篇論文中,研究人員使用流行的異步進化算法(asynchronous evolutionary algorithm)的正則化版本,并將其與非正則化的形式以及強化學習方法進行比較。硬件條件、計算能力和神經網絡訓練代碼都相同,在這之中研究人員探索在不同的數據集、搜索空間和規模下模型的表現情況。以下是論智對論文的編譯總結。

實驗方法

我們使用不同的算法搜索神經網絡分類器的空間,進行基線研究后,所得到的最好的模型將被擴大尺寸,以生產更高質量的圖像分類器。我們在不同的計算規模上執行搜索過程。另外,我們還研究了非神經網絡模擬中的進化算法。

1.搜索空間

所有神經進化和強化學習實驗都使用基線研究的搜索空間設計,它需要尋找兩個類似于Inception的模塊體系結構,這兩個結構在前饋模式中堆疊以形成圖像分類器。

2.架構搜索算法

對于進化算法,我們使用聯賽選擇算法(tournament selection)或正則化的變體。標準的聯賽選擇算法是對訓練模型P的數量進行周期化的改進。在每個循環中,隨機選擇一個S模型的樣本。樣本的最佳模型將生成具有變化架構的另一模型,它將被訓練然后添加到模型樣本中。最差的模型將被刪除。我們將這種方法稱為非正則進化(NRE)。它的變體,正則化進化(RE)則是一種自然的修正:無需刪除樣本中最差的模型,而是刪除樣本中最老的模型(即第一個被訓練的模型)。在NRE和RE中,樣本初始化的架構都是隨機的。

3.實驗設置

為了對比進化算法和強化學習算法,我們將在不同的計算規模上進行實驗。

小規模試驗

首先進行的實驗可以在CPU上進行,我們部署了SP-I、SP-II和SP-III三種搜索空間,利用G-CIFAR、MNIST或者G-ImageNet數據集進行實驗。

大規模實驗

然后再部署基線研究的設置。這里僅用SP-I搜索空間和CIFAR-10數據集,兩種模型各在450個GPU上訓練將近7天。

4.模型擴展

我們要將進化算法或強化學習發現的架構轉化為全尺寸、精確的模型。擴展后的模型將在CIFAR-10或ImageNet上進行訓練,程序與基線研究的相同。

實驗結果

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

正則化與非正則化進化的對比。(a)表示在G-CIFAR數據集上非正則化進化和正則化進化用不同的元參數進行的小規模實驗結果對比。P代表樣本數量,S代表樣本大小。(b)表示NRE和RE在五種不同情況下的表現,從左至右分別為:G-CIFAR/SP-I、G-CIFAR/SP-II、G-CIFAR/SP-III、MNIST/SP-I和G-ImageNet/SP-I。(c)表示模擬結果,豎軸表示模擬的精確度,橫軸表示問題的維度。(d)表示在CIFAR-10上進行的三次大規模試驗。

接著,我們在不同的情況下對強化學習和進化算法進行了小規模實驗,結果如下:

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

(a)顯示了在G-CIFAR上對超參數進行優化的實驗總結,豎軸表示實驗中前100名的模型的平均有效精度。結果表明所所有方法都不夠敏感。(b)同樣是在模型五種不同情況下的表現:G-CIFAR/SP-I、G-CIFAR/SP-II、G-CIFAR/SP-III、MNIST/SP-I和G-ImageNet/SP-I。(c)和(d)表示模型分別在G-CIFAR/SP-II和G-CIFAR/SP-III上的表現細節,橫軸表示模型的數量。(e)表示在資源有限的情況下,可能需要盡早停止實驗。說明了在初始狀態下,進化算法的精確度比強化學習增長得快得多。(f)和(g)分別是SP-I和SP-III最頂尖的架構。

比較完小規模實驗,接著進行的是大規模實驗。結果如下圖所示,黃色代表進化算法,藍色代表強化學習:

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

除了(d)圖,所有橫軸均表示模型的數量(m)。(a)、(b)、(c)三圖分別展示了三種算法在五次相同實驗的情況,進化算法和強化學習實驗使用了最佳元參數。

經過進化實驗,我們確定了最佳模型并將其命名為AmoebaNet-A。通過調整N和F,我們可以降低測試錯誤率,如表1所示:

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

表1

在相同的實驗條件下,基線研究得到了NASNet-A。表2顯示,在CIFAR-10數據集中,AmoebaNet-A在匹配參數時錯誤率較低,在匹配錯誤時,參數較少。同時在ImageNet上的表現也是目前最好的。

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

表2

最后我們對比了手動設計、其他架構以及我們模型的性能對比,準確率均高于其他兩種。

解析圖像分類器結構搜索的正則化異步進化方法 并和強化學習方法進行對比

表3

結語

大規模的實驗過程圖表明,強化學習和進化算法都接近一般精度漸近線,所以我們需要關注的是哪個算法更快到達。圖中顯示強化學習要用兩倍的時間到達最高精度的一半,換句話說,進化算法的速度大約比強化學習快一倍。但是我們忽略了進一步量化這一效果。另外,搜索空間的大小還需進一步評估。大空間所需專業資源較少,而小空間能更快更好地獲得結果。因此,在較小空間中很難區分哪種搜索算法更好。

不過,這一研究僅僅是在特定環境下分析進化算法和強化學習之間關系的第一個實證研究,我們希望今后的工作能進一步總結二者,闡釋兩種方法的優點。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 進化算法
    +關注

    關注

    0

    文章

    10

    瀏覽量

    7420
  • 強化學習
    +關注

    關注

    4

    文章

    268

    瀏覽量

    11301

原文標題:圖像分類器結構搜索的正則化異步進化方法

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    漸進式神經網絡結構搜索技術

    我們提出一種學習卷積神經網絡(CNN)結構的新方法,該方法比現有的基于強化學習進化算法的技術更
    的頭像 發表于 08-03 09:32 ?5477次閱讀

    深度強化學習實戰

    內容2:課程一: TensoRFlow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實現:1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL4、對抗性生成
    發表于 01-10 13:42

    一種基于機器學習的建筑物分割掩模自動正則和多邊形方法

    摘要我們提出了一種基于機器學習的建筑物分割掩模自動正則和多邊形方法。以圖像為輸入,首先使用通
    發表于 09-01 07:19

    深度學習技術的開發與應用

    2.算法設計 3.實驗結果高頻問題:如何將一個控制問題設計成馬爾可夫決策問題并使用強化學習算法進行訓練關鍵點:1.基于模型的離線強化學習方法 2.基于數據的在線強化學習方法實操
    發表于 04-21 14:57

    圖像分類方法之深度學習與傳統機器學習

    實際情況非常復雜,傳統的分類方法不堪重負。現在,我們不再試圖用代碼來描述每一個圖像類別,決定轉而使用機器學習方法處理
    發表于 09-28 19:43 ?0次下載

    基于數據挖掘的醫學圖像分類方法

    一種深度學習的新方法卷積受限玻爾茲曼機模型,并且采用改進的快速持續對比散度算法對模型進行訓練。該方法直接從乳腺X光
    發表于 11-22 16:32 ?8次下載

    斯坦福提出基于目標的策略強化學習方法——SOORL

    為了達到人類學習的速率,斯坦福的研究人員們提出了一種基于目標的策略強化學習方法——SOORL,把重點放在對策略的探索和模型選擇上。
    的頭像 發表于 06-06 11:18 ?5449次閱讀
    斯坦福提出基于目標的策略<b class='flag-5'>強化學習方法</b>——SOORL

    使用加權密集連接卷積網絡的深度強化學習方法說明

    針對深度強化學習中卷積神經網絡(CNN)層數過深導致的梯度消失問題,提出一種將密集連接卷積網絡應用于強化學習方法。首先,利用密集連接卷積網絡中的跨層連接結構
    發表于 01-23 10:41 ?3次下載
    使用加權密集連接卷積網絡的深度<b class='flag-5'>強化學習方法</b>說明

    谷歌和DeepMind研究人員合作提出新的強化學習方法Dreamer 可利用世界模型實現高效的行為學習

    近年來隨著強化學習的發展,使得智能體選擇恰當行為以實現目標的能力得到迅速地提升。目前研究領域主要使用兩種方法:一種是無模型(model-free)的強化學習方法,通過試錯的方式來學習
    發表于 03-26 11:41 ?1997次閱讀

    深度學習圖像分割的方法和應用

    介紹使圖像分割的方法,包括傳統方法和深度學習方法,以及應用場景。 基于人工智能和深度學習方法的現代計算機視覺技術在過去10年里取得了顯著進展
    的頭像 發表于 11-27 10:29 ?3243次閱讀

    進化算法為搜索策略實現神經架構搜索方法

    自動深度學習是目前深度學習領域的研究熱點,神經架構搜索算法是實現自動深度學習的主要
    發表于 03-22 14:37 ?15次下載
    以<b class='flag-5'>進化</b>算法為<b class='flag-5'>搜索</b>策略實現神經架構<b class='flag-5'>搜索</b>的<b class='flag-5'>方法</b>

    模型深度強化學習應用研究綜述

    強化學習。無模型強仳學習方法的訓練過程需要大量樣本,當采樣預算不足,無法收集大量樣本時,很難達到預期效果。然而,模型強化學習可以充分利用環境模型,降低真實樣本需求量,在一定程度上提高
    發表于 04-12 11:01 ?9次下載
    模型<b class='flag-5'>化</b>深度<b class='flag-5'>強化學習</b>應用研究綜述

    基于深度強化學習的無人機控制律設計方法

    基于深度強化學習的無人機控制律設計方法
    發表于 06-23 14:59 ?46次下載

    使用深度學習方法對音樂流派進行分類

    電子發燒友網站提供《使用深度學習方法對音樂流派進行分類.zip》資料免費下載
    發表于 02-08 10:02 ?1次下載
    使用深度<b class='flag-5'>學習方法</b>對音樂流派<b class='flag-5'>進行</b><b class='flag-5'>分類</b>

    如何使用 PyTorch 進行強化學習

    強化學習(Reinforcement Learning, RL)是一種機器學習方法,它通過與環境的交互來學習如何做出決策,以最大化累積獎勵。PyTorch 是一個流行的開源機器學習庫,
    的頭像 發表于 11-05 17:34 ?394次閱讀
    主站蜘蛛池模板: 在线欧美视频免费观看国产 | 全免费a级毛片免费看不卡 全日本爽视频在线 | 在线观看的黄网 | yy肉戏多纯黄的小说 | 色综合久久九月婷婷色综合 | 97夜夜操 | 1024免费永久福利视频 | 三级毛片网 | 国产一区二区在线观看免费 | www.成人av.com | 国产性夜夜性夜夜爽91 | 91在线电影 | 亚洲一二 | 91插插视频| 色婷五月综激情亚洲综合 | 精品手机在线视频 | 欧美性狂猛bbbbbxxxxx | hs网站免费| 污污视频在线免费看 | 国产福利午夜自产拍视频在线 | 俺去啦最新网址 | 男人和女人做a免费视频 | 国内精品久久久久久久久野战 | 国产一区二区三区在线观看视频 | 女人张开双腿让男人桶爽免 | 色天使久久综合给合久久97色 | 婷婷成人丁香五月综合激情 | 午夜视频在线看 | 中文字幕第7页 | 五月天婷婷网站 | 影音先锋 色天使 | 色多多免费视频 | 国产美女作爱全过程免费视频 | 夜夜橹橹网站夜夜橹橹 | 黄色国产视频 | 亚洲一区亚洲二区 | 四虎4hu影库永久地址 | 毛片三级在线观看 | 国产一区二区三区免费大片天美 | 亚洲美女高清一区二区三区 | 欧美日本一区二区三区道 |