在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AlphaGo首席研究員談強(qiáng)化學(xué)習(xí)十大黃金法則!

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-17 08:41 ? 次閱讀

近日,谷歌DeepMind強(qiáng)化學(xué)習(xí)研究團(tuán)隊(duì)負(fù)責(zé)人、AlphaGo項(xiàng)目首席研究員Dave Silver在Deep Learning Indaba活動(dòng)的主題演講中歸納出了強(qiáng)化學(xué)習(xí)中要注意的10大要點(diǎn)。一起來(lái)看看,也許能少走點(diǎn)彎路。

近日,在南非斯泰倫博斯舉行的Deep Learning Indaba活動(dòng)上,谷歌DeepMind強(qiáng)化學(xué)習(xí)研究團(tuán)隊(duì)負(fù)責(zé)人、AlphaGo項(xiàng)目首席研究員Dave Silver在主題演講中歸納出強(qiáng)化學(xué)習(xí)中要注意的10大要點(diǎn)。

活動(dòng)主辦方將Dave Silver演講的PPT截圖和文字要點(diǎn)發(fā)在了推特上,引發(fā)了廣泛討論。

Silver的演講中提出的強(qiáng)化學(xué)習(xí)10大要點(diǎn)涵蓋涉及算法評(píng)估、狀態(tài)控制、建模函數(shù)等方面的心得和建議,非常值得開發(fā)者機(jī)器學(xué)習(xí)愛好者參考學(xué)習(xí)。一起看看他是怎么說的吧!

1、在評(píng)估中產(chǎn)生進(jìn)步

客觀、量化的估計(jì)會(huì)產(chǎn)生進(jìn)步,對(duì)評(píng)估尺度的選擇會(huì)決定進(jìn)步的方向。這可能是項(xiàng)目推進(jìn)過程中做出的最重要的決定。

目標(biāo)驅(qū)動(dòng)型研究:確認(rèn)評(píng)估標(biāo)準(zhǔn)與最終目標(biāo)密切相關(guān)。避免主觀評(píng)估

假設(shè)驅(qū)動(dòng)型研究:提出假設(shè),在寬泛的條件下驗(yàn)證假設(shè),與相似結(jié)果對(duì)比,而不是與最先進(jìn)的結(jié)果對(duì)比。重要的是對(duì)結(jié)果的理解,而不是追求排名。

2、算法的可擴(kuò)展性決定是否成功

算法的可擴(kuò)展性是指其性能隨資源的梯度變化。這里的資源可能是計(jì)算、存儲(chǔ)和數(shù)據(jù)。算法的可擴(kuò)展性決定了能否項(xiàng)目能否成功,它幾乎永遠(yuǎn)比算法的起點(diǎn)重要。最終,好的算法總是無(wú)限資源條件下的最優(yōu)解決方案。

3、穩(wěn)定算法的通用性

算法通用性是指算法在不同深度學(xué)習(xí)環(huán)境下的表現(xiàn)。應(yīng)避免對(duì)當(dāng)前任務(wù)的過擬合。積極尋求可以適用于未來(lái)未知環(huán)境下的算法。

結(jié)論:要廣泛驗(yàn)證,建立現(xiàn)實(shí)的機(jī)器學(xué)習(xí)環(huán)境。

4、 信任智能體的經(jīng)驗(yàn)

經(jīng)驗(yàn)(包括觀察、動(dòng)作、獎(jiǎng)勵(lì))是指深度學(xué)習(xí)的數(shù)據(jù)。信任這些經(jīng)驗(yàn),將其作為唯一知識(shí)來(lái)源。盡管這些經(jīng)驗(yàn)看上去不可學(xué)習(xí),但最終長(zhǎng)期來(lái)看,經(jīng)驗(yàn)終將取得成功。

5、狀態(tài)是主觀的

智能體應(yīng)該基于經(jīng)驗(yàn)建立自身的狀態(tài),智能體的狀態(tài)是關(guān)于其先前狀態(tài)和新觀察數(shù)據(jù)的函數(shù)。任何時(shí)候不要定義某一環(huán)境下的“真實(shí)”狀態(tài)。

6、控制數(shù)據(jù)流

智能體處于大量數(shù)據(jù)流傳感器環(huán)境中,智能體的行為會(huì)對(duì)數(shù)據(jù)流造成影響。

控制特征——控制數(shù)據(jù)流——控制未來(lái)——實(shí)現(xiàn)任何回報(bào)的最大化。

7、價(jià)值函數(shù)可以對(duì)世界建模

價(jià)值函數(shù)是對(duì)未來(lái)的高效歸納和緩存。多關(guān)注固定時(shí)間段的查找,而非指數(shù)級(jí)的前瞻??梢元?dú)立計(jì)算和學(xué)習(xí)。利用多價(jià)值函數(shù)可以在不同時(shí)間范圍內(nèi),對(duì)世界各個(gè)方面進(jìn)行高效建模。

應(yīng)避免使用原始的時(shí)間步長(zhǎng)對(duì)世界進(jìn)行建模。

8、從想象的經(jīng)驗(yàn)中進(jìn)行學(xué)習(xí)

想象接下來(lái)會(huì)發(fā)生什么,從想象的經(jīng)驗(yàn)中進(jìn)行學(xué)習(xí),同時(shí)關(guān)注在當(dāng)前時(shí)刻的值函數(shù)估計(jì)。

9、加強(qiáng)函數(shù)逼近器

差異化網(wǎng)絡(luò)架構(gòu)是一種有力工具,可以用來(lái):以豐富的方式表示狀態(tài),實(shí)現(xiàn)差異化存儲(chǔ)、差異化規(guī)劃、層級(jí)控制。

將算法的復(fù)雜性融入網(wǎng)絡(luò)架構(gòu),可以降低算法的復(fù)雜度,增加網(wǎng)絡(luò)架構(gòu)的可表達(dá)性。

10、要學(xué)習(xí)“如何學(xué)習(xí)”

人工智能的發(fā)展史呈現(xiàn)出一條清晰的發(fā)展脈絡(luò)。

第一代:“美好的”老式人工智能。手動(dòng)控制預(yù)測(cè),不學(xué)習(xí)任何內(nèi)容。

第二代:淺度學(xué)習(xí)。手動(dòng)控制特征,學(xué)習(xí)預(yù)測(cè)。

第三代:深度學(xué)習(xí)。手動(dòng)控制算法(優(yōu)化器、目標(biāo)、架構(gòu)),學(xué)習(xí)特征和端對(duì)端預(yù)測(cè)。

第四代:Meta學(xué)習(xí)。無(wú)手動(dòng)環(huán)節(jié),學(xué)習(xí)算法、特征和端對(duì)端預(yù)測(cè)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6195

    瀏覽量

    106016
  • 強(qiáng)化學(xué)習(xí)

    關(guān)注

    4

    文章

    268

    瀏覽量

    11301
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    10939

原文標(biāo)題:AlphaGo首席研究員親授!十張PPT,十大強(qiáng)化學(xué)習(xí)黃金法則!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    年度電解槽十大品牌+年度制氫十大供應(yīng)商,穩(wěn)石氫能榮獲兩大獎(jiǎng)項(xiàng)!

    此前,2024年10月16日,由國(guó)能網(wǎng)與國(guó)能能源研究院聯(lián)合舉辦的第九屆新能源行業(yè)品牌盛典(GPBC)圓滿召開,穩(wěn)石氫能榮獲2024年度·氫能行業(yè)品牌榜“年度電解槽十大品牌”與“年度制氫十大供應(yīng)商”兩大獎(jiǎng)項(xiàng)!
    的頭像 發(fā)表于 01-24 14:53 ?87次閱讀

    華為發(fā)布2025智能光伏十大趨勢(shì)

    華為數(shù)字能源以“融合創(chuàng)新,智構(gòu)未來(lái),加速光伏成為主力能源”為主題,舉辦2025智能光伏十大趨勢(shì)發(fā)布會(huì)。華為數(shù)字能源智能光伏產(chǎn)品線總裁周濤發(fā)布了智能光伏十大趨勢(shì)和重磅白皮書,為光儲(chǔ)產(chǎn)業(yè)的高質(zhì)量發(fā)展提供前瞻性支持。
    的頭像 發(fā)表于 01-06 17:12 ?428次閱讀

    如何在化學(xué)和材料科學(xué)領(lǐng)域開展有影響力的人工智能研究?(三)

    第三部分編譯后的內(nèi)容:4.如何解決科學(xué)問題?在掌握了上述的工具和視角后,我們將提出一些建議,幫助您在化學(xué)領(lǐng)域選擇具有影響力的研究課題,并介紹機(jī)器學(xué)習(xí)問題的高層次結(jié)構(gòu)。最后,我們將概述機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 12-03 01:02 ?272次閱讀
    如何在<b class='flag-5'>化學(xué)</b>和材料科學(xué)領(lǐng)域開展有影響力的人工智能<b class='flag-5'>研究</b>?(三)

    螞蟻集團(tuán)收購(gòu)邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室首席科學(xué)家

    領(lǐng)域的研究與發(fā)展。令人矚目的是,邊塞科技的創(chuàng)始人吳翼已正式加入該實(shí)驗(yàn)室,并擔(dān)任首席科學(xué)家一職。 吳翼在其個(gè)人社交平臺(tái)上對(duì)這一變動(dòng)進(jìn)行了回應(yīng)。他表示,自己最近接受了螞蟻集團(tuán)的邀請(qǐng),負(fù)責(zé)大模型強(qiáng)化學(xué)習(xí)領(lǐng)域的
    的頭像 發(fā)表于 11-22 11:14 ?709次閱讀

    全國(guó)5G新基建智慧燈桿建設(shè)十大代表性案例

    全國(guó)5G新基建智慧燈桿建設(shè)十大代表性案例
    的頭像 發(fā)表于 11-07 12:50 ?747次閱讀
    全國(guó)5G新基建智慧燈桿建設(shè)<b class='flag-5'>十大</b>代表性案例

    選擇精科睿進(jìn)行 PCBA 代工代料有以下十大理由

    選擇精科睿進(jìn)行 PCBA 代工代料有以下十大理由:
    的頭像 發(fā)表于 11-06 10:21 ?229次閱讀

    如何使用 PyTorch 進(jìn)行強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)是一種機(jī)器學(xué)習(xí)方法,它通過與環(huán)境的交互來(lái)學(xué)習(xí)如何做出決策,以最大化累積獎(jiǎng)勵(lì)。PyTorch 是一個(gè)流行的開源機(jī)器學(xué)習(xí)庫(kù),
    的頭像 發(fā)表于 11-05 17:34 ?394次閱讀

    谷歌AlphaChip強(qiáng)化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用

    近日,谷歌在芯片設(shè)計(jì)領(lǐng)域取得了重要突破,詳細(xì)介紹了其用于芯片設(shè)計(jì)布局的強(qiáng)化學(xué)習(xí)方法,并將該模型命名為“AlphaChip”。據(jù)悉,AlphaChip有望顯著加速芯片布局規(guī)劃的設(shè)計(jì)流程,并幫助芯片在性能、功耗和面積方面實(shí)現(xiàn)更優(yōu)表現(xiàn)。
    的頭像 發(fā)表于 09-30 16:16 ?470次閱讀

    年預(yù)言:Chiplet的使命

    來(lái)源: 晶上世界 無(wú)論是人工智能深度學(xué)習(xí)、大數(shù)據(jù)實(shí)時(shí)分析,還是超算中心的復(fù)雜模擬,都對(duì)芯片算力提出了前所未有的需求。大算力時(shí)代,如何駕馭數(shù)據(jù)洪流? 中國(guó)科學(xué)院計(jì)算技術(shù)研究所韓銀和研究員為我們揭示了
    的頭像 發(fā)表于 08-27 11:09 ?538次閱讀
    <b class='flag-5'>十</b>年預(yù)言:Chiplet的使命

    中國(guó)信通院發(fā)布“2024云計(jì)算十大關(guān)鍵詞”

    7月23日,由中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)主辦,中國(guó)信息通信研究院(簡(jiǎn)稱“中國(guó)信通院”)承辦的“2024可信云大會(huì)”在京召開。大會(huì)上,中國(guó)信通院正式發(fā)布“2024云計(jì)算十大關(guān)鍵詞”,中國(guó)信通院云計(jì)算與大數(shù)
    的頭像 發(fā)表于 08-02 08:28 ?711次閱讀
    中國(guó)信通院發(fā)布“2024云計(jì)算<b class='flag-5'>十大</b>關(guān)鍵詞”

    開關(guān)電源PCB布局優(yōu)化,人人都該懂的“黃金法則”是什么?

    問:開關(guān)電源板布局的黃金法則優(yōu)化電路板布局是開關(guān)電源設(shè)計(jì)中的一個(gè)關(guān)鍵。良好的布局可確保開關(guān)穩(wěn)壓器的穩(wěn)定運(yùn)行,并將輻射干擾和傳導(dǎo)電磁干擾(EMI)降至。雖然這是電子開發(fā)人員所熟知的常識(shí),但很多人還是
    發(fā)表于 07-01 17:11

    通過強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇

    更快更好地學(xué)習(xí)。我們的想法是找到最優(yōu)數(shù)量的特征和最有意義的特征。在本文中,我們將介紹并實(shí)現(xiàn)一種新的通過強(qiáng)化學(xué)習(xí)策略的特征選擇。我們先討論強(qiáng)化學(xué)習(xí),尤其是馬爾可夫決策
    的頭像 發(fā)表于 06-05 08:27 ?414次閱讀
    通過<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>策略進(jìn)行特征選擇

    蘇州納米城助力園區(qū)再登“MEMS傳感器十大園區(qū)名單”榜首!

    近日,在第六屆中國(guó)(蚌埠)MEMS智能傳感器產(chǎn)業(yè)發(fā)展大會(huì)上,國(guó)家工信部所屬單位中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院發(fā)布《2024中國(guó)MEMS產(chǎn)業(yè)發(fā)展與十大高質(zhì)量傳感器園區(qū)報(bào)告》,蘇州工業(yè)園區(qū)連續(xù)4年蟬聯(lián)“MEMS傳感器十大園區(qū)名單”榜首。
    的頭像 發(fā)表于 05-31 14:16 ?858次閱讀
    蘇州納米城助力園區(qū)再登“MEMS傳感器<b class='flag-5'>十大</b>園區(qū)名單”榜首!

    DC3漏洞披露計(jì)劃已接獲5635份研究員報(bào)告,總數(shù)逾5萬(wàn)

    據(jù)報(bào)道,為應(yīng)對(duì)日益嚴(yán)峻的網(wǎng)絡(luò)安全威脅,美國(guó)五角大樓于2016年正式設(shè)立了網(wǎng)絡(luò)犯罪中心(DC3)。近日,該機(jī)構(gòu)公布數(shù)據(jù),自創(chuàng)立至今累計(jì)收到5635位研究員遞交的5萬(wàn)余份漏洞報(bào)告。
    的頭像 發(fā)表于 03-20 13:55 ?739次閱讀

    上海微技術(shù)研究院標(biāo)準(zhǔn)180nm硅光工藝在八英寸SOI上制備了硅光芯片

    近日,中國(guó)科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所硅基材料與集成器件實(shí)驗(yàn)室蔡艷研究員、歐欣研究員聯(lián)合團(tuán)隊(duì),在通訊波段硅基鈮酸鋰異質(zhì)集成電光調(diào)制器方面取得了重要進(jìn)展。
    的頭像 發(fā)表于 03-18 14:30 ?1165次閱讀
    上海微技術(shù)<b class='flag-5'>研究</b>院標(biāo)準(zhǔn)180nm硅光工藝在八英寸SOI上制備了硅光芯片
    主站蜘蛛池模板: 免费一级大毛片a一观看不卡 | 午夜在线视频观看 | 国产专区日韩精品欧美色 | 四虎永久在线免费观看 | 亚洲四虎影院 | 香蕉视频黄色在线观看 | 美女被曹 | 国产三级日本三级美三级 | 女人张腿让男子桶免费动态图 | 大尺度视频网站久久久久久久久 | 久久精品综合 | 亚洲天天做日日做天天欢毛片 | 一级特黄高清完整大片 | 天天摸夜夜操 | 欧美性猛片xxxxⅹ免费 | 女bbbbxxxx另类亚洲 | 扒开双腿爽爽爽视频www | 日本在线视频不卡 | 性色欧美xo影院 | 日本高清中文字幕在线观穿线视频 | 久久精品乱子伦观看 | 91久久婷婷国产综合精品青草 | 在线看片一区 | 美女一级a毛片免费观看 | 天天插天天干天天操 | 亚洲福利一区二区 | 真实女人寂寞偷人视频 | 中国一级特黄特级毛片 | 小视频国产 | 性欧美成人依依影院 | 手机看片1024免费视频 | 亚洲人成网站在线观看妞妞网 | 新版天堂中文在线8官网 | 日本不卡一区在线 | 777奇米影视笫四色88me久久综合 | 国产叼嘿视频网站在线观看 | 男女交性动态免费视频 | 亚洲欧洲色 | 黄视频日本| 特级做a爰片毛片免费看一区 | 黄色网在线播放 |