在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

預測深度神經網絡泛化性能差異

Tensorflowers ? 來源:YXQ ? 作者:h1654155287.6125 ? 2019-07-28 10:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度神經網絡 (DNN) 是近年來機器學習研究進展的基礎,也是在圖像識別、圖像分割、機器翻譯等諸多領域能夠取得突破性進展的重要原因。

盡管 DNN 無處不在,研究人員仍在嘗試全面了解深度神經網絡的基本原理。例如,傳統理論(如 VC 維和 Rademacher 復雜度)認為:在處理未知數據時,過參數化函數 (over-parameterized functions) 的泛化能力較差;但在近期研究中卻發現,大規模過參數化的函數(參數比數據點多出幾個數量級)卻擁有出色的泛化能力,更深層次地地理解泛化對于理論的落地和DNN理論的實現從而改進模型是很有必要的。

在理解泛化之前,我們需了解 Generalization Gap(泛化性能差異)這一重要概念。泛化性能差異即模型針對相同分布的訓練數據和未知數據所表現出的性能差異。在致力獲得更好的 DNN 泛化邊界(即泛化性能差異的上限)的過程中,研究人員取得了重大進展。但是,這類邊界通常仍會大大高估真實的泛化性能差異水平,并且無法解釋部分模型為何具有出色的泛化能力。

另一方面,研究人員基于支持向量機 (support-vector machines) 等淺層模型對邊緣 (notion) 概念(即數據點與決策邊界之間的距離)進行了大量研究,最終發現此概念與模型針對未知數據所表現出的泛化能力密切相關。基于此項發現,研究人員已將使用邊緣研究泛化性能差異的方法拓展至 DNN 領域,從而使泛化性能差異的理論上限得到了高度優化,但此方式并未能顯著提高泛化模型的預測能力。

注:理論上限 鏈接

支持向量機決策邊界示例。w?x-b=0 定義的超平面是此線性分類器的“決策邊界”,即在該線性分類器下,超平面上的每個點 x 在任一類中的可能性相等。

ICLR 2019 論文《使用邊緣分布預測深度網絡的泛化性能差異》(Predicting the Generalization Gap in Deep Networks with Margin Distributions) 中,我們提議在各層網絡上使用標準化的邊緣分布 (Normalized Margin Distribution) 來預測泛化性能差異。

我們通過實踐研究了邊緣分布與泛化之間的關系,最終發現在對距離進行適當標準化 (Normalization) 后,邊緣分布的一些基本數據可以準確預測泛化性能差異。此外,我們還通過 GitHub 代碼庫將所有模型作為數據集公開發布,以便您進行泛化研究。

每張圖均對應一個基于 CIFAR-10 訓練的卷積神經網絡(分類準確率各不相同)。三個模型各有差異,從左至右,泛化能力逐漸增強。其中,x 軸表示 4 個層的神經網絡標準化邊緣分布,y 軸表示此分布的概率密度。標準化的邊緣分布與測試準確率密切相關,這表明我們可以將此類分布用作預測網絡 Generalization Gap(泛化性能差異)的指標。如需了解這些神經網絡的更多詳情,請參閱我們的論文。

邊緣分布作為泛化性能差異的預測指標

如果邊緣分布統計數據可以真實預測泛化性能差異,那么簡單的預測方案應能建立起二者的關系。

因此,我們選擇使用線性回歸作為預測指標。我們發現,在對邊緣分布統計數據進行對數轉換后,轉換后的數據與 泛化性能差異之間幾乎完全呈線性關系(參見下圖)。事實上,相較于其他現有的泛化測量方法,我們提出的方案可提供更準確的預測。這表明,邊緣分布可能包含與深度模型泛化性能差異相關的重要信息。

基于 CIFAR-100 和 ResNet-32 得出的 Generalization Gap 預測值(x 軸)與實際值(y 軸)關系圖。數據點的分布趨近于貼近對角線,這表明該對數線性模型的預測值非常符合實際的 Generalization Gap 水平。

深度模型泛化數據集

除論文之外,我們還介紹了深度模型泛化 (DEMOGEN) 數據集。該數據集包含 756 個經過訓練的深度模型,以及這些深度模型在 CIFAR-10 和 CIFAR-100 數據集上的訓練與及測試表現。這些模型均為 CNN(所用架構類似于“網絡中的網絡”(Network-in-Network))和 ResNet-32 的變體,它們采用當下流行的各類正則化技術和超參數設置,因而也產生了廣泛的泛化行為。

例如,基于 CIFAR-10 訓練的 CNN 模型的測試準確率在 60% 至 90.5% 之間,泛化性能差異率則介于 1% 至 35% 之間。如需了解數據集詳情,請查看我們的論文或 GitHub 代碼庫。發布數據集時,我們還為其添加了許多實用程序,以便您能夠輕松加載模型,并重現論文中所展示的結果。

我們希望本次研究和 DEMOGEN 數據集能為社區提供便利工具,讓社區成員無需重新訓練大量模型,即可研究深度學習領域的泛化問題而提供便利工具。同時,我們也希望本次研究成果能夠提供助力,以幫助我們日后對隱藏層中的泛化性能差異預測指標和邊緣分布進行更加深入的研究。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4812

    瀏覽量

    103215
  • 機器學習
    +關注

    關注

    66

    文章

    8499

    瀏覽量

    134331

原文標題:預測深度神經網絡泛化性能差異

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BP神經網絡的優缺點分析

    自學習能力 : BP神經網絡能夠通過訓練數據自動調整網絡參數,實現對輸入數據的分類、回歸等任務,無需人工進行復雜的特征工程。 化能力強 : BP神經網絡通過訓練數據學習到的特征表示
    的頭像 發表于 02-12 15:36 ?860次閱讀

    BP神經網絡深度學習的關系

    BP神經網絡深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 一、BP神經網絡的基本概念 BP神經網絡,即反向傳播神經網絡(Ba
    的頭像 發表于 02-12 15:15 ?806次閱讀

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的深度神經網絡
    的頭像 發表于 07-24 10:42 ?1158次閱讀

    殘差網絡深度神經網絡

    殘差網絡(Residual Network,通常簡稱為ResNet) 是深度神經網絡的一種 ,其獨特的結構設計在解決深層網絡訓練中的梯度消失和梯度爆炸問題上取得了顯著的突破,并因此成為
    的頭像 發表于 07-11 18:13 ?1563次閱讀

    神經網絡辨識模型具有什么特點

    ,可以對未知數據進行預測,具有很好的化能力。 自學習能力 :神經網絡通過反向傳播算法等優化算法,可以自動調整網絡參數,實現自學習。 并行處理能力 :
    的頭像 發表于 07-11 11:12 ?843次閱讀

    bp神經網絡預測模型建模步驟

    介紹BP神經網絡預測模型的建模步驟。 數據預處理 數據預處理是構建BP神經網絡預測模型的第一步,主要包括以下幾個方面: 1.1 數據收集 首先需要收集足夠的數據,這些數據可以是歷史數據
    的頭像 發表于 07-11 10:52 ?1111次閱讀

    神經網絡預測模型的構建方法

    神經網絡模型作為一種強大的預測工具,廣泛應用于各種領域,如金融、醫療、交通等。本文將詳細介紹神經網絡預測模型的構建方法,包括模型設計、數據集準備、模型訓練、驗證與評估等步驟,并附以代碼
    的頭像 發表于 07-05 17:41 ?1508次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?1750次閱讀

    神經網絡預測誤差大小怎么看

    神經網絡預測誤差大小是衡量神經網絡性能的重要指標之一。本文將介紹如何評估神經網絡預測誤差大小,包
    的頭像 發表于 07-03 10:41 ?2255次閱讀

    神經網絡擬合的誤差怎么分析

    像識別、自然語言處理和時間序列預測等。然而,神經網絡的擬合誤差是一個關鍵問題,影響模型的性能化能力。本文將從多個角度分析神經網絡擬合誤差
    的頭像 發表于 07-03 10:36 ?1163次閱讀

    如何使用神經網絡進行建模和預測

    神經網絡是一種強大的機器學習技術,可以用于建模和預測變量之間的關系。 神經網絡的基本概念 神經網絡是一種受人腦啟發的計算模型,由大量的節點(神經
    的頭像 發表于 07-03 10:23 ?1291次閱讀

    bp神經網絡深度神經網絡

    BP神經網絡(Backpropagation Neural Network)是一種常見的前饋神經網絡,它使用反向傳播算法來訓練網絡。雖然BP神經網絡在某些方面與
    的頭像 發表于 07-03 10:14 ?1359次閱讀

    bp神經網絡模型怎么算預測

    BP神經網絡(Backpropagation Neural Network,簡稱BP網絡)是一種多層前饋神經網絡,它通過反向傳播算法來調整網絡中的權重和偏置,從而實現對輸入數據的
    的頭像 發表于 07-03 09:59 ?1182次閱讀

    卷積神經網絡和bp神經網絡的區別

    不同的神經網絡模型,它們在結構、原理、應用等方面都存在一定的差異。本文將從多個方面對這兩種神經網絡進行詳細的比較和分析。 引言 神經網絡是一種模擬人腦
    的頭像 發表于 07-02 14:24 ?6065次閱讀

    深度神經網絡模型有哪些

    深度神經網絡(Deep Neural Networks,DNNs)是一類具有多個隱藏層的神經網絡,它們在許多領域取得了顯著的成功,如計算機視覺、自然語言處理、語音識別等。以下是一些常見的深度
    的頭像 發表于 07-02 10:00 ?2393次閱讀
    主站蜘蛛池模板: 免费精品一区二区三区在线观看 | 国产三级视频在线播放 | 永久视频在线观看 | 黑色丝袜美美女被躁视频 | 很黄很暴力 很污秽的小说 很黄很黄叫声床戏免费视频 | 日本操穴| 夜色伊人| 国产gaysexchina男同men1068 | 女人精69xxxxxx | 永久免费观看午夜视频在线 | 欧美一级特黄视频 | 亚洲第一成人在线 | 午夜在线观看完整高清免费 | 岛国毛片在线观看 | haodiaose在线精品免费观看 | 天堂在线最新版资源www | 久久天天丁香婷婷中文字幕 | 色综合图片二区150p | 欧美女同在线观看 | 免费一级特黄特色黄大任片 | 黄视频网站免费观看 | 日韩精品一区二区三区免费视频 | 国产黄色网 | 波多野结衣第一页 | 草久久久久 | 美女久久久 | 奇米久久久 | 免费性bbbb台湾| 最近2018年在线中文字幕高清 | vr性资源在线观看 | 羞涩妩媚玉腿呻吟嗯啊销魂迎合 | 狠狠色噜噜狠狠狠狠米奇777 | 久久久久国产精品免费网站 | 日韩精品三级 | 国产精品99r8免费视频2022 | 午夜激情福利网 | 黄色小毛片 | 天天插伊人 | 亚洲国产人久久久成人精品网站 | 污污的黄色小说 | 51久久 |