在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習領域的強化學習技術有什么用處?

我快閉嘴 ? 來源:教育新聞網 ? 作者:教育新聞網 ? 2020-08-12 16:21 ? 次閱讀

來自查爾默斯大學和哥德堡大學的跨學科研究團隊開發(fā)了一個框架,用于研究語言如何演變?yōu)槊枋鲂睦砀拍畹挠行Чぞ摺T谝黄抡撐闹校麄儽砻鳎斯ご砜梢詫W習如何以類似于人類語言的人工語言進行交流。該結果已發(fā)表在科學雜志《PLOS ONE》上。

這項研究位于認知科學和機器學習之間的邊界。認知科學家提出了一個有影響力的建議,即所有人類語言都可以看作是進化成為一種以經典信息論的意義以接近最優(yōu)的方式傳達概念的手段。哥德堡研究人員訓練人工代理的方法是基于強化學習的,強化學習是機器學習的一個領域,代理通過與環(huán)境交互并獲得反饋逐漸學習。在這種情況下,代理人在沒有任何語言知識的情況下開始學習,并通過獲取有關他們在傳達思想觀念方面的成功程度的反饋來學習交流。

重建色彩

“在我們的論文中,我們研究了代理商如何通過打幾輪由發(fā)送者和聽者組成的參考游戲來學習命名心理概念和進行交流。我們特別關注了在認知科學中已深入研究的色域。游戲的工作方式如下;發(fā)送方看到一種顏色,并通過從詞匯表向聽眾說出一個單詞來描述顏色,然后嘗試重建顏色。

根據收聽者重建的精確程度,這兩個代理都會收到共享的獎勵。詞匯表中的單詞一開始就沒有意義;在游戲的多個回合中,由代理商決定單詞的含義。我們看到,從信息論的角度來看,由此產生的人工語言幾乎是最優(yōu)的,并且具有與人類語言相似的特性。” Sleepcycle研究人員MikaelK?geb?ck說,他在Chalmers的博士學位論文中包含了一些結果在論文中提出。

與哥德堡大學語言理論和概率研究中心(CLASP)計算機語言學研究人員Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起。他是計算機科學與工程系數據科學和AI部門的學生,現在已經發(fā)表了結果。

Asad Sayeed說:“從實際的角度來看,這項研究提供了開發(fā)與人類語言進行交流的對話主體(例如Siri和Alexa)的基本原理。”

通過強化學習來學習交流的基本思想對于社會和文化領域的研究也很有趣,例如,由阿薩德·薩耶德(Asad Sayeed)領導的GRIPES項目,該項目研究狗舌政治。

在將來的研究中有用

“認知實驗非常耗時,因為您經常需要對人類志愿者進行仔細的實驗。我們的方法提供了一種非常強大,靈活且廉價的方法來研究這些基本問題。實驗完全在我們的控制之下,可重復且完全可靠因此,我們的計算框架為研究認知科學,語言和交互作用中的基本問題提供了一種有價值的工具。對于計算機科學家來說,探索各種學習機制的有效性是一個肥沃的領域。” Devdatt Dubhashi說。

Emil Carlsson說:“將來,我們要調查代理商是否也可以在其他領域發(fā)展類似于人類語言的交流。一個例子就是我們的代理商是否能夠重構我們在人類語言中觀察到的等級結構。”

長期存在的問題

該研究源于認知科學和語言學一個長期存在的中心問題:在人類語言的所有巨大多樣性中,是否存在共同的普遍原則。20世紀的經典作品表明,用不同的語言來描述顏色具有共同的特性。是否有解釋這些共同屬性的基本原則?

認知科學家最近提出的一項有影響力的建議是,從信息論的角度來看,當語言被視為一種交流思想概念,最有效地利用資源的手段時,確實存在著這樣的普遍通用原則。

麻省理工學院的特德·吉布森(Ted Gibson)于2016年在CLASP上發(fā)表了一系列演講,他在演講中描述了從世界各地不同社會和文化中選出的人類受試者的實驗結果,從而引發(fā)了一個問題:“如果人類受試者被人造計算機替代,將會怎樣代理,他們會開發(fā)一種具有類似通用屬性的語言嗎?”
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7546

    瀏覽量

    88690
  • AI
    AI
    +關注

    關注

    87

    文章

    31615

    瀏覽量

    270426
  • 機器學習
    +關注

    關注

    66

    文章

    8442

    瀏覽量

    133103
收藏 人收藏

    評論

    相關推薦

    DAC1282的正弦波模式什么用處

    ADS1282增益校準時,需要外部提供和增益匹配的滿量程電壓,這個電壓可以由DAC1282提供。我想問的是: 1.DAC1282的正弦波模式什么用處? 2.采用哪種模式提供電壓最好?
    發(fā)表于 12-31 07:03

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數據的機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發(fā)表于 12-30 09:16 ?405次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    動態(tài)互動的。 該理論強調智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務的能力。具身智能的實現涵蓋了機器學習、人工智能、機器人學、計算機視覺、自然語言處理及強化學
    發(fā)表于 12-20 19:17

    zeta在機器學習中的應用 zeta的優(yōu)缺點分析

    的應用(基于低功耗廣域物聯(lián)網技術ZETA) ZETA作為一種低功耗廣域物聯(lián)網(LPWAN)技術,雖然其直接應用于機器學習的場景可能并不常見,但它可以通過提供高效、穩(wěn)定的物聯(lián)網通信支持,
    的頭像 發(fā)表于 12-20 09:11 ?368次閱讀

    請問TSC2007中的AUX引腳什么用處

    TSC2007中的AUX 引腳什么用處
    發(fā)表于 12-13 07:08

    螞蟻集團收購邊塞科技,吳翼出任強化學習實驗室首席科學家

    領域的研究與發(fā)展。令人矚目的是,邊塞科技的創(chuàng)始人吳翼已正式加入該實驗室,并擔任首席科學家一職。 吳翼在其個人社交平臺上對這一變動進行了回應。他表示,自己最近接受了螞蟻集團的邀請,負責大模型強化學習領域的研究工
    的頭像 發(fā)表于 11-22 11:14 ?730次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經驗”在計算機系統(tǒng)中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智能數據分析技術的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?521次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域機器學習算法是實現智能系統(tǒng)的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發(fā)表于 11-15 09:19 ?617次閱讀

    如何使用 PyTorch 進行強化學習

    強化學習(Reinforcement Learning, RL)是一種機器學習方法,它通過與環(huán)境的交互來學習如何做出決策,以最大化累積獎勵。PyTorch 是一個流行的開源
    的頭像 發(fā)表于 11-05 17:34 ?412次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI很多技術,但其中一個很大的子集是機器學習——讓算法從數據中學習
    發(fā)表于 10-24 17:22 ?2545次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    谷歌AlphaChip強化學習工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用

    近日,谷歌在芯片設計領域取得了重要突破,詳細介紹了其用于芯片設計布局的強化學習方法,并將該模型命名為“AlphaChip”。據悉,AlphaChip有望顯著加速芯片布局規(guī)劃的設計流程,并幫助芯片在性能、功耗和面積方面實現更優(yōu)表現。
    的頭像 發(fā)表于 09-30 16:16 ?476次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    主,包括廣告分析領域應用、智能運維領域應用和金融領域的應用。 那什么是時間序列呢?時間序列有什么用途呢?經過學習第一章“時間序列概述“,我找
    發(fā)表于 08-11 17:55

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管
    的頭像 發(fā)表于 07-01 11:40 ?1552次閱讀

    通過強化學習策略進行特征選擇

    更快更好地學習。我們的想法是找到最優(yōu)數量的特征和最有意義的特征。在本文中,我們將介紹并實現一種新的通過強化學習策略的特征選擇。我們先討論強化學習,尤其是馬爾可夫決策
    的頭像 發(fā)表于 06-05 08:27 ?417次閱讀
    通過<b class='flag-5'>強化學習</b>策略進行特征選擇

    一文詳解Transformer神經網絡模型

    Transformer模型在強化學習領域的應用主要是應用于策略學習和值函數近似。強化學習是指讓機器在與環(huán)境互動的過程中,通過試錯來
    發(fā)表于 02-20 09:55 ?1.7w次閱讀
    一文詳解Transformer神經網絡模型
    主站蜘蛛池模板: 在线免费黄色网址 | 韩国三级视频在线 | 四虎在线观看免费视频 | 久久www成人看片 | 免费看黄视频网站 | 天天做天天爱天天一爽一毛片 | 天堂色综合| 丁香花在线 | 在线看黄网站 | 久久人人干| 亚洲欧美7777 | 一级黄色录像视频 | 免费看黄色网 | 中文字幕天天躁夜夜狠狠综合 | 久操色 | 激情五月婷婷在线 | 久久久久久噜噜噜久久久精品 | 5151四虎永久在线精品免费 | 亚洲综合一区二区 | 色多多免费视频 | 激情婷婷在线 | 亚洲综合图片人成综合网 | eeuss影院www影院夜场 | 护士巨好爽好大乳 | 欧美一区二区三区大片 | 精品一区二区三区免费爱 | 奇米77| 免费永久视频 | 五月婷婷六月爱 | 丁香激情五月 | 国产小视频在线免费 | 日韩欧美一区二区三区视频 | 成人欧美一区二区三区 | 男女交性动态免费视频 | 欧美人成网 | 国产网站免费视频 | 成人观看网站a | 亚色影视 | 激五月| good韩国理论在线三级 | 美女被免费网站视频在线 |