在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Jürgen Schmidhuber:無監督神經網絡在極大極小上的博弈

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-24 09:27 ? 次閱讀

編者按:如果說GAN的發展史上有什么戲劇性事件,那“LSTM之父”Jürgen Schmidhuber(發音:You_again Shmidhoobuh)和“GAN之父”Ian Goodfellow之間的恩怨絕對是其中最精彩的一幕。在2016的NIPS大會上,Schmidhuber和Goodfellow就GAN是否借鑒了前者在九十年代發表的一篇論文展開了激烈爭論,引得滿座震驚。雖然事后學界認可了GAN的原創性,但Schmidhuber似乎對此仍然耿耿于懷。近日,他發表了一篇小短文,文章的主角還是幾十年前的那個模型——PM。

1990s,無監督神經網絡在最小值上的博弈 每個網絡最小化由另一個網絡最大化的值函數 或生成實驗,產生對好奇心的內在獎勵

在對人工神經網絡(NN)的研究中,研究人員最重要的目標之一是創建能從給定數據中學習統計數據的算法。為了實現這一目標,我在20世紀90年代曾引入一種新型無監督學習機制,它基于極大極小博弈中的梯度下降/上升原理,其中一個NN負責最小化由另一個NN最大化的目標函數。我把發生在這兩個無監督神經網絡之間的對抗稱為“可預測性最小化”(Predictability Minimization)。

首先,PM需要一個自帶初始隨機權重的編碼器網絡,它通過其輸入節點(下圖中的白色圓圈)接收數據樣本(例如圖像),并在其輸出節點(下圖中的灰色圓圈,也稱編碼節點)生成對應編碼。每個編碼節點都可以在區間[0,1]內被激活。

圖中的黑色圓圈表示一個獨立的預測網絡,經過訓練后,給定一部分編碼節點,它能學習每個編碼節點的條件期望,從而預測所有未提供的編碼節點。雖然圖中沒有標出,編碼網絡和預測網絡都有隱藏節點。

但是,每個編碼節點都希望自己能變得更不可預測。因此它需要經過訓練,最大限度地提高由預測網絡最小化的目標函數(如均方誤差)。預測器和編碼器相互對抗,以激勵編碼器實現無監督學習的“圣杯”——關于輸入數據的理想的、展開的、二元的階乘編碼,其中每個編碼節點在統計上彼此互相獨立。

理想情況下,NN在經過學習后,給定數據模式的概率就應該等于其編碼節點概率的乘積,這個概率也是預測網絡的輸出。

無獨有偶,生成對抗網絡(GAN)也使用無監督的極小極大原理來模擬給定數據的統計數據。相信讀者都熟悉NIPS 2014的那篇GAN論文,雖然那位作者聲稱PM并不是基于值函數的極大極小博弈,不是一個網絡尋求最大化而另一個尋求最小化,相比GAN那種“網絡之間的對抗是唯一訓練標準,并且足以完成訓練”的方法,PM只能算“一個正則,鼓勵神經網絡的隱藏節點在完成其他任務時在統計上獨立,其對抗性不是主要的訓練方法”。

但是,我覺得PM確實也是個純粹的極大極小博弈,尤其是它也對抗訓練,“網絡之間的對抗是唯一訓練標準,并且足以完成訓練”。

將無監督極大極小博弈用于強化學習好奇心

還是20世紀90年代,PM論文發表后,我曾嘗試過把這個想法擴展到強化學習領域,構建具有人工好奇心的智能體。

我構建了一個目標是在環境中生成動作序列的神經網絡C,它的動作生成的由一個追求回報最大化的節點控制。作為參考,我設計了一個名叫世界模型M的獨立神經網絡,它能根據給定的以往輸入和動作預測未來輸入。動作選擇越合理,網絡得到的回報就越高,因此C所獲得的內在回報和M的預測誤差成正比。同時,因為C試圖最大化的正是M試圖最小化的值函數,這意味著C會盡力探索M無法準確預測的新動作。

最近關于好奇心的強化學習論文有很多,我覺得它們都是基于這個簡單的90年代的原理。尤其是在97年的那篇論文中[UARL3-5],我讓兩個對抗的、追求回報最大化的模塊(左腦和右腦)共同設計一個實驗:一個能定義如何在環境中執行動作序列、如何通過實現由實驗觸發的觀察序列的可計算函數(如二元分類)的指令序列來計算最終實驗結果的(概率)程序。

兩個模塊都能提前預測實驗結果,如果它們的預測或假設不同,那么在動作生成和執行完畢后,失敗一方會向這個零和博弈的優勝一方提供內在回報。這種設計促使無監督的兩個模塊專注于“有趣”的事情,也就是不可預測的空間。同樣的,在沒有外部回報的情況下,每個無監督模塊都在試圖最大化由另一個最小化的值函數。

當時我在論文中提出,如果想把這種方法用于現實世界的某些問題,我們還需要科學家和藝術家的人為介入,設置合理的外部回報。而時至今日,很多人也確實正在用它處理數據分布建模和人工好奇心等任務。

小結

看到這里,相信大家都看出來了,Jürgen Schmidhuber還是放不下對GAN的糾結,或者說,是對“對抗”這種方法的執念。雖然GAN的原創性已無爭議,但比起抬高/貶低Schmidhuber的為人,我們都不能否認他對深度學習作出的杰出貢獻。2年前,他也正是以一種幾乎“鬧劇”的方式警告所有人,在過去幾十年的研究中,可能存放著許多不為人知的珍寶,它們不是不夠優秀,而只是輸給了時代。

正如網友評價的:

作為機器學習的英雄,我們追隨他;作為超越時代的罪人,我們圍攻他。但他都可以接受,因為他不是英雄。他只是一個沉默的守護者,一個警惕的保護者,一個Schmidhuber。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3669

    瀏覽量

    135245
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101171
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1965

    瀏覽量

    74239

原文標題:Jürgen Schmidhuber:無監督神經網絡在極大極小上的博弈

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    脈沖耦合神經網絡FPGA的實現誰會?

    脈沖耦合神經網絡(PCNN)FPGA的實現,實現數據分類功能,有報酬。QQ470345140.
    發表于 08-25 09:57

    基于賽靈思FPGA的卷積神經網絡實現設計

    FPGA 實現卷積神經網絡 (CNN)。CNN 是一類深度神經網絡處理大規模圖像識別任務以及與機器學習類似的其他問題方面已大獲成功。在當前案例中,針對
    發表于 06-19 07:24

    卷積神經網絡如何使用

    卷積神經網絡(CNN)究竟是什么,鑒于神經網絡工程經歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發表于 07-17 07:21

    【案例分享】基于BP算法的前饋神經網絡

    期望的輸出。BP神經網絡算法推導(更新權重和偏倚):從上面推導可以發現:對于任意從神經元i(輸出神經元/隱層神經元)至 神經
    發表于 07-21 04:00

    【案例分享】ART神經網絡與SOM神經網絡

    是一種常用的監督學習策略,使用改策略時,網絡的輸出神經元相互競爭,每一時刻只有一個競爭獲勝的神經
    發表于 07-21 04:30

    如何設計BP神經網絡圖像壓縮算法?

    (Digital Signal Processor)相比,現場可編程門陣列(Field Programma-ble Gate Array,FPGA)神經網絡的實現更具優勢。DSP處理器
    發表于 08-08 06:11

    如何用卷積神經網絡方法去解決機器監督學習下面的分類問題?

    人工智能下面有哪些機器學習分支?如何用卷積神經網絡(CNN)方法去解決機器學習監督學習下面的分類問題?
    發表于 06-16 08:09

    如何構建神經網絡

    原文鏈接:http://tecdat.cn/?p=5725 神經網絡是一種基于現有數據創建預測的計算系統。如何構建神經網絡神經網絡包括:輸入層:根據現有數據獲取輸入的層隱藏層:使用反向傳播優化輸入變量權重的層,以提高模型的預測
    發表于 07-12 08:02

    STM32驗證神經網絡模型

    STM32CubeMx.AI的使用歡迎使用Markdown編輯器STM32論壇中看到這樣一個視頻:視頻中,STM32驗證神經網絡模型
    發表于 08-03 06:59

    卷積神經網絡一維卷積的處理過程

    以前的神經網絡幾乎都是部署云端(服務器),設備端采集到數據通過網絡發送給服務器做inference(推理),結果再通過網絡返回給設備端。
    發表于 12-23 06:16

    卷積神經網絡模型發展及應用

    舉足輕重的地位。由于卷積 神經網絡的模型十分豐富,有些模型的結構或用途 比較特殊,本文中統稱為特殊模型,包括具有簡單的結構和很少參數量的擠壓網絡模型 SqueezeNet,采 用
    發表于 08-02 10:39

    神經網絡原理下載-免費

    神經網絡是計算智能和機器學習研究的最活躍的分支之一。本書全面系統地介紹神經網絡的基本概念,系統理論和實際應用。本書包含四個組成部分:導論,監督學習,
    發表于 06-19 14:39 ?190次下載

    圖靈獎為什么沒頒給LSTM之父Jürgen Schmidhuber

    因為他堅持認為現在大火的GAN就是PM的變種,兩者的區別就在于方向是反的,為此,Jürgen Schmidhuber還和GAN的提出者Ian Goodfellow有過線上線下激烈的交鋒,業界至今記憶猶新。
    的頭像 發表于 04-08 11:54 ?9286次閱讀

    基于監督淺層神經網絡聯合學習的表示方法

    學習模型主要基于節點結構相似和節點內容相似,不能同時有效捕獲節點結構和內容的相似信息,因此結構和內容等價混合的網絡數據上表現較差。為此,探索了節點結構相似和節點內容相似的融合特征,提岀了一種基于
    發表于 04-23 11:22 ?11次下載
    基于<b class='flag-5'>無</b><b class='flag-5'>監督</b>淺層<b class='flag-5'>神經網絡</b>聯合學習的表示方法

    神經網絡如何用監督算法訓練

    神經網絡作為深度學習的重要組成部分,其訓練方式多樣,其中監督學習是一種重要的訓練策略。監督學習旨在從未標記的數據中發現數據內在的結構、模
    的頭像 發表于 07-09 18:06 ?896次閱讀
    主站蜘蛛池模板: 亚洲黄色成人 | 午夜操一操 | 国产午夜精品一区二区理论影院 | 久久国产乱子伦精品免费一 | 日韩美aaa特级毛片 日韩美a一级毛片 | 色拍视频 | 成年片色大黄全免费网址 | www伊人| 亚洲国产一区二区三区在线观看 | 222aaa免费| 男女做视频网站免费观看 | 欧美视频在线观在线看 | 欧美午夜性春猛xxxx | eeuss影院www影院夜场 | 黄网站色视频免费看无下截 | 午夜伦伦 | 久久久久久天天夜夜天天 | 五月天婷婷在线观看高清 | 欧美午夜精品一区二区三区 | 久久视频精品36线视频在线观看 | 丁香婷婷综合网 | 色噜噜久久 | 啪啪网站免费观看 | a天堂中文在线 | 久久伊人影视 | 中文字幕在线一区二区三区 | 国产99在线播放免费 | 日韩高清性爽一级毛片免费 | 亚洲性天堂| 99久久无色码中文字幕 | 我想看三级特黄 | 国产毛片哪里有 | 午夜欧美精品 | 美国色天使 | 日本一视频一区视频二区 | 国产视频日本 | 久久影院朴妮唛 | 高清国产在线观看 | 国产精品资源网站在线观看 | 欧美一级高清片欧美国产欧美 | 手机午夜视频 |