在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind設(shè)置強迫機制使AI實現(xiàn)利益最大化

汽車玩家 ? 來源:大數(shù)據(jù)文摘微信公眾號 ? 作者:趙吉克 ? 2020-03-16 09:24 ? 次閱讀

最近谷歌DeepMind提出了一種新的強化學(xué)習(xí)技術(shù),這種技術(shù)以一種全新方式來模擬人類行為。它可能會比之前發(fā)布的人工智能決策系統(tǒng)更強大,這對希望通過自動化提高生產(chǎn)率的企業(yè)來說可能是個福音。

如何解決多方零和博弈中的合作困境?

DeepMind用強化學(xué)習(xí)使AI實現(xiàn)利益最大化。這是一種基于對等契約機制的經(jīng)濟競爭模型,該模型允許在多方博弈中結(jié)盟。這篇論文其中一位作者表示,這種結(jié)盟有單打獨斗不具有的特殊優(yōu)勢。

長期以來,零和游戲以其豐富的策略選擇空間和清晰的策略評估方式指導(dǎo)著人工智能研究。更重要的是這種競爭廣泛存在于生物界、市場經(jīng)濟甚至是AlphaZero中。

DeepMind科學(xué)家首先尋求數(shù)學(xué)定義形成聯(lián)盟的挑戰(zhàn),關(guān)注聯(lián)盟形成多玩家零和游戲——也就是說,數(shù)學(xué)表示的情況下,每個參與者的收益或損失的效用是完全平衡的損失或收益的其他參與者的效用。

什么是多方零和博弈?

DeepMind將之定義為每個玩家的收益或損失完全由其余玩家的損失或收益提供。在一個對稱多方零和博弈中,每個玩家的行為模式都是一樣的,這往往會產(chǎn)生社會困境。(一個極簡例子是“囚徒困境”)

零和博弈引入了合作后事情變得很復(fù)雜。緊急情況下,團隊必須內(nèi)部協(xié)調(diào)才能有效地在游戲中競爭。合作形成的過程本身就是一個社會困境——從直覺上看,玩家應(yīng)該合作來擊敗其他人,但合作團隊內(nèi)部要求個體為更廣泛的利益做出妥協(xié),但這種犧牲未必和他們的自身利益一致。此外,決定加入或離開哪個團隊以及團隊策略都是重要問題。

DeepMind嘗試了一種“禮物游戲”,在游戲中,AI扮演的玩家從一堆標(biāo)記著自己代表色的數(shù)字籌碼開始。在每個玩家的回合中,他們必須拿出自己對應(yīng)顏色的籌碼并將其贈送給另一名玩家,或?qū)⑵錀壷谩H客婕叶际プ约簩?yīng)顏色的數(shù)字籌碼時游戲結(jié)束,此時擁有最多顏色籌碼的玩家獲勝,贏家平分價值為“1”的籌碼,其他玩家平分價值為“0”的籌碼。

研究發(fā)現(xiàn),玩家往往表現(xiàn)得很自私,他們囤積籌碼以至于出現(xiàn)了三方平局。但事實上,如果兩名玩家交換籌碼,回報會更好。DeepMind將這種過程闡述為:盡管合作能帶來更好的結(jié)果,但人人都想從欺騙行為中獲利,也就是說服對方交換然后食言。

這也就是說,如果有一種機制能維護合作行為存在,那強化學(xué)習(xí)可以適應(yīng)這種博弈。這種機制就是合同——在游戲中,每個玩家必須提交一份報價,首先選擇合作伙伴,然后為該合作伙伴提出行動建議,最后玩家承諾采取的行動。如果兩個玩家提供了相同的契約,那么這些契約就具有了約束力,也就是說環(huán)境強制執(zhí)行了所承諾的操作。

這種強制性機制是合作形成的基礎(chǔ)。

這種模型能讓我們在更廣闊的應(yīng)用環(huán)境中思考契約的作用。一個沒有強制實施機制的契約系統(tǒng)如果可以在多方動態(tài)博弈中持續(xù)運行將最終產(chǎn)生一個有價值的反饋回路,這將使得AI的應(yīng)用走向社會學(xué)和經(jīng)濟學(xué)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6221

    瀏覽量

    107373
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33973

    瀏覽量

    274872
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    借助DFT技術(shù)實現(xiàn)競爭力最大化

    通過改進和優(yōu)化設(shè)計與制造的各個方面,半導(dǎo)體行業(yè)已經(jīng)能夠實現(xiàn) IC 能力的巨大進步。可測試性設(shè)計 (DFT)——涵蓋從在 RTL 中插入測試邏輯,到對現(xiàn)場退回產(chǎn)品進行失效分析等全流程,是半導(dǎo)體企業(yè)獲得
    的頭像 發(fā)表于 05-22 15:16 ?154次閱讀

    利用NVIDIA Aerial平臺推動AI-RAN與6G研究

    電信行業(yè)正加速采用 AI 技術(shù),以實現(xiàn)即使在信號強度不佳的條件下也能夠提供無縫連接,同時最大化可持續(xù)性與頻譜效率(單位帶寬內(nèi)可傳輸?shù)男畔⒘浚?/div>
    的頭像 發(fā)表于 03-25 14:55 ?409次閱讀

    英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    聯(lián)合計劃涵蓋基礎(chǔ)設(shè)施和開源模型優(yōu)化,在機器人、藥物研發(fā)等領(lǐng)域取得巨大進展 具有長期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項新計劃,旨在推動 AI 發(fā)展、普及 AI 工具
    的頭像 發(fā)表于 03-21 15:10 ?985次閱讀
    英偉達GTC2025亮點:NVIDIA、Alphabet 和<b class='flag-5'>谷歌</b>攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來

    EE-19:最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導(dǎo)內(nèi)存效率

    電子發(fā)燒友網(wǎng)站提供《EE-19:最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導(dǎo)內(nèi)存效率.pdf》資料免費下載
    發(fā)表于 01-14 16:09 ?0次下載
    EE-19:<b class='flag-5'>最大化</b>DSP-21xx系列DSP(不包括ADSP-218x)的引導(dǎo)內(nèi)存效率

    EE-365:在ADSP-CM40x混合信號控制處理器上實現(xiàn)ADC采樣速率最大化

    電子發(fā)燒友網(wǎng)站提供《EE-365:在ADSP-CM40x混合信號控制處理器上實現(xiàn)ADC采樣速率最大化.pdf》資料免費下載
    發(fā)表于 01-13 16:52 ?0次下載
    EE-365:在ADSP-CM40x混合信號控制處理器上<b class='flag-5'>實現(xiàn)</b>ADC采樣速率<b class='flag-5'>最大化</b>

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌
    的頭像 發(fā)表于 01-13 14:40 ?572次閱讀

    光伏發(fā)電如何實現(xiàn)能效最大化

    光伏發(fā)電實現(xiàn)能效最大化是一個綜合性的問題,需要從多個方面入手。以下是一些關(guān)鍵措施: 一、選用優(yōu)質(zhì)設(shè)備 太陽能板 :選用具有高光電轉(zhuǎn)化效率和穩(wěn)定性的太陽能板是基礎(chǔ)。例如,單晶硅太陽能板通常比多
    的頭像 發(fā)表于 12-05 11:06 ?722次閱讀

    NVIDIA與谷歌量子AI部門達成合作

    NVIDIA CUDA-Q 平臺使谷歌量子 AI 研究人員能夠為其量子計算機創(chuàng)建大規(guī)模的數(shù)字模型,以解決設(shè)計中面臨的各種挑戰(zhàn)
    的頭像 發(fā)表于 11-20 09:39 ?562次閱讀

    KM振動分析與動平衡服務(wù)實現(xiàn)工廠設(shè)備效率最大化

    振動儀
    KM預(yù)測性維護專家
    發(fā)布于 :2024年10月16日 15:57:14

    擴展塢使用技巧:如何最大化你的筆記本電腦接口能力

    最大化您的筆記本電腦接口能力,以下是一些實用的擴展塢使用技巧: 了解您的需求:在購買擴展塢之前,明確您需要哪些類型的端口(如HDMI, USB-C, RJ45等)以及是否需要充電功能,以選擇最適合
    的頭像 發(fā)表于 10-08 10:52 ?1071次閱讀

    液冷充電槍線最大化提高充電效率

    法法易提供的液冷充電槍線可以最大化的提升充電效率,讓大家的充電時間進一步縮短。? 液冷充電槍線使用液體循環(huán)來冷卻電纜,以避免因高溫而導(dǎo)致電纜損壞或充電速度減緩。而且液冷充電槍線采用銅芯導(dǎo)線和耐高溫、耐磨損、
    的頭像 發(fā)表于 09-11 14:25 ?744次閱讀

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。
    的頭像 發(fā)表于 07-16 18:29 ?792次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>DeepMind</b>被曝抄襲開源成果,論文還中了頂流會議

    谷歌借助Gemini AI系統(tǒng)深化對機器人的訓(xùn)練

    7月12日,國際科技界傳來新動態(tài),谷歌正借助其先進的Gemini AI系統(tǒng),深化對旗下機器人的訓(xùn)練,旨在顯著提升它們的導(dǎo)航能力和任務(wù)執(zhí)行能力。DeepMind機器人團隊最新發(fā)布的研究論文,詳細闡述
    的頭像 發(fā)表于 07-12 16:29 ?833次閱讀

    谷歌AI新突破:為無聲視頻智能配音

    近日,谷歌DeepMind團隊公布了一項革命性的技術(shù)——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術(shù)。這一技術(shù)的出現(xiàn),不僅為視頻創(chuàng)作領(lǐng)域帶來了新的可能,也為觀眾帶來了更加豐富的視聽體驗。
    的頭像 發(fā)表于 06-21 10:50 ?694次閱讀

    榮耀新品將搭載谷歌AI功能,提升生成式AI體驗

    榮耀于5月22日宣布,將在新款智能手機上集成谷歌AI功能,實現(xiàn)生成式AI體驗。此外,新機還將得到谷歌云服務(wù)的支持。
    的頭像 發(fā)表于 05-23 08:51 ?696次閱讀
    主站蜘蛛池模板: 亚洲成人精品 | 日本一区二区在线视频 | 亚洲综合丁香 | 九月丁香婷婷 | xx肥妇人爽妇网 | 经典三级一区二区三区视频 | 在线天堂中文新版有限公司 | 国产精品臀控福利在线观看 | 日本tv欧美tv天堂 | 欧美成人精品一区二三区在线观看 | 国产精品成人免费观看 | 三级电影在线观看视频 | 四虎国产永久在线观看 | 痴女中文字幕在线视频 | 毛片在线看免费版 | 久久久精品免费 | 久久久久久免费观看 | 九九re热| 国产三级日本三级韩国三级在线观看 | 特级毛片免费视频播放 | bt种子搜索-bt天堂 | 国产亚洲视频在线播放大全 | 爱爱小视频免费看 | mide-776中文字幕在线 | 88av免费| 日本黄色片在线播放 | 天天在线影院 | 国产三级精品三级在线观看 | 优优优色 | 日本免费一级视频 | 在线色网| bt在线天堂| 女同性大尺度床戏视频 | 亚洲乱论| 亚洲好骚综合 | 亚洲日本欧美日韩高观看 | 亚洲一区二区高清 | 色男人在线 | 天天综合天天看夜夜添狠狠玩 | 欧美另类bbw | 色播在线永久免费视频网站 |