在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦的“世界模型”簡(jiǎn)述與啟發(fā)

mK5P_AItists ? 來(lái)源:lq ? 2019-01-30 09:48 ? 次閱讀

摘要:我們的視覺(jué)看到什么,部分取決于大腦預(yù)測(cè)未來(lái)會(huì)看到什么。

我們的視覺(jué)看到什么,部分取決于大腦預(yù)測(cè)未來(lái)會(huì)看到什么,例如下圖中,如果你預(yù)計(jì)要看到突出的球體,那也許你就會(huì)看到,如果讓機(jī)器也具有了這樣的能力,會(huì)帶來(lái)什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復(fù)雜的環(huán)境中通過(guò)自我學(xué)習(xí)產(chǎn)生相應(yīng)的策略,例如玩賽車(chē)游戲。

下面是世界模型的整體架構(gòu):

整個(gè)模型分為3個(gè)組件:視覺(jué)組件(V),記憶組件(M),控制組件(C)。視覺(jué)組件V用來(lái)壓縮圖片信息到一個(gè)隱變量z上(其實(shí)只是一個(gè)VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個(gè)rollout),輸出是預(yù)測(cè)下一幀圖像的可能分布,其實(shí)就是比一般LSTM更高級(jí)一些的MDN-RNN:

最后控制組件C的目標(biāo),就是把前面視覺(jué)組件V和記憶組件M的輸出一起作為輸入,并輸出這個(gè)時(shí)刻智能體agent應(yīng)該做出的動(dòng)作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒(méi)有是谷歌大腦自己創(chuàng)新研制的。但世界模型會(huì)很大提高強(qiáng)化學(xué)習(xí)訓(xùn)練穩(wěn)定性和成績(jī) 從而使其與其他強(qiáng)化學(xué)習(xí)相比有一些明顯優(yōu)勢(shì),如下表所示;

世界模型有如下的3個(gè)特點(diǎn)

1. 模型拼接得足夠巧妙,這個(gè)巧妙的拼接模型做到所謂的世界想象能力,就是模型在學(xué)習(xí)時(shí),自身對(duì)環(huán)境假想一個(gè)模擬的環(huán)境,甚至可以在沒(méi)有環(huán)境訓(xùn)練的情況下,自己想象一個(gè)環(huán)境去訓(xùn)練。其實(shí)就是我們?nèi)祟?lèi)鏡像神經(jīng)元的功能。

2. 抓住了一些“強(qiáng)視覺(jué)”游戲的“痛點(diǎn)”。記憶組件M中的RNN是生成序列的能手,所以根據(jù)之前游戲圖像再“想象”一些圖像幀應(yīng)該不成問(wèn)題(RNN生成一些隱變量z,再根據(jù)隱變量z,由視覺(jué)組件VAE的decode生成的圖像幀即可)。所以對(duì)于“強(qiáng)視覺(jué)”的游戲,把RNN的記憶能力用在視覺(jué)預(yù)測(cè)和控制上是個(gè)好主意 。

3不同于我們常見(jiàn)的“不可生”智能算法,例如遺傳算法和進(jìn)化策略只是強(qiáng)調(diào)了基因的“變異”與在解空間中進(jìn)行搜索,神經(jīng)網(wǎng)絡(luò)只是固定網(wǎng)絡(luò)結(jié)構(gòu);而生物界的基因卻可以指導(dǎo)蛋白質(zhì)構(gòu)成并且“生長(zhǎng)”。如果基因可以構(gòu)造自身個(gè)體,外部環(huán)境和個(gè)體情況也可以反過(guò)來(lái)影響基因,而我們的模型都太固定呆板了,模型結(jié)構(gòu)不能隨內(nèi)部隱變量改進(jìn),當(dāng)然最佳的設(shè)計(jì)形式也許誰(shuí)也不知道。而世界模型做到了讓在內(nèi)部”幻想“的環(huán)境中產(chǎn)生的策略轉(zhuǎn)移到外部世界中。

最后簡(jiǎn)單看一下世界模型的訓(xùn)練過(guò)程:

world models代碼基于chainer計(jì)算框架,步驟如下:

1. 準(zhǔn)備數(shù)據(jù)集,隨機(jī)玩游戲生成訓(xùn)練幀(rollouts意思應(yīng)該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓(xùn)練視覺(jué)組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓(xùn)練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓(xùn)練控制組件C,即前面提到的CMA-ES算法(其實(shí)就是支持更復(fù)雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測(cè)試訓(xùn)練結(jié)果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6228

    瀏覽量

    107773
  • 機(jī)器
    +關(guān)注

    關(guān)注

    0

    文章

    790

    瀏覽量

    41169
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    282

    瀏覽量

    10995

原文標(biāo)題:谷歌大腦的“世界模型”簡(jiǎn)述與啟發(fā)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    世界模型:多模態(tài)融合+因果推理,解鎖AI認(rèn)知邊界

    電子發(fā)燒友網(wǎng)綜合報(bào)道 在人工智能的蓬勃發(fā)展進(jìn)程中,世界模型正嶄露頭角,成為推動(dòng)其邁向更高智能水平的關(guān)鍵力量。世界模型作為 AI 系統(tǒng)對(duì)外部世界
    的頭像 發(fā)表于 06-23 04:49 ?1173次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 Pro 實(shí)驗(yàn)
    的頭像 發(fā)表于 02-07 15:07 ?675次閱讀

    英偉達(dá)推出基石世界模型Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問(wèn)題

    CES 2025展會(huì)上,英偉達(dá)推出了基石世界模型Cosmos,World Foundation Model基石世界模型,簡(jiǎn)稱WFM。 物理 AI
    的頭像 發(fā)表于 01-14 11:04 ?1083次閱讀
    英偉達(dá)推出基石<b class='flag-5'>世界</b><b class='flag-5'>模型</b>Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問(wèn)題

    華為、理想、特斯拉、商湯的世界模型是做什么用的

    最近世界模型(World Model)很火,甚至有人說(shuō)世界模型是終極自動(dòng)駕駛解決方案,實(shí)際上它只是端到端大模型的一種,和VLM沒(méi)有本質(zhì)區(qū)別。
    的頭像 發(fā)表于 01-14 09:27 ?875次閱讀
    華為、理想、特斯拉、商湯的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是做什么用的

    英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型

    近日,在2025年1月6日于拉斯維加斯拉開(kāi)帷幕的國(guó)際消費(fèi)類(lèi)電子產(chǎn)品展覽會(huì)(CES)上,英偉達(dá)宣布了一項(xiàng)重大創(chuàng)新——Cosmos世界基礎(chǔ)模型平臺(tái)。該平臺(tái)集成了先進(jìn)的生成世界基礎(chǔ)模型,旨在
    的頭像 發(fā)表于 01-09 10:23 ?660次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺(tái)由先進(jìn)的生成式世界基礎(chǔ)模型、高級(jí) tokenizer、護(hù)欄和加速視頻處理管線組成,將推動(dòng)自動(dòng)駕駛汽車(chē)(AV)和機(jī)器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?513次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢(shì)可以帶來(lái)顯著的成果。通過(guò)利用谷歌的 Gemini 模型來(lái)制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成高質(zhì)
    的頭像 發(fā)表于 01-03 10:38 ?844次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen<b class='flag-5'>模型</b>生成高質(zhì)量圖像

    【「大模型啟示錄」閱讀體驗(yàn)】對(duì)本書(shū)的初印象

    對(duì)大模型的利用還停留在非常表層的階段,遠(yuǎn)未達(dá)到其真正的潛力。我對(duì)大模型的深層作用和深遠(yuǎn)影響的理解還相當(dāng)有限。我渴望能夠更深入地了解大模型,探索它們?nèi)绾嗡茉煳覀兊?b class='flag-5'>世界,以及如何更好地將這
    發(fā)表于 12-16 14:05

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫(xiě)輔助。 Gemini 2.0通過(guò)高級(jí)推理和長(zhǎng)上
    的頭像 發(fā)表于 12-12 10:13 ?615次閱讀

    OpenAI世界最貴大模型:昂貴背后的技術(shù)突破

    2023年“雙十二”的第一天,OpenAI推出了其最強(qiáng)推理模型o1的滿血版及其Pro版本。同時(shí),ChatGPT也推出了每月200美元的Pro訂閱計(jì)劃,這一價(jià)格使其一躍成為“世界最貴的大模型”。下面,AI部落小編帶您深入了解Ope
    的頭像 發(fā)表于 12-06 14:46 ?1007次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動(dòng)駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車(chē)業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語(yǔ)言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“端到端多模態(tài)自動(dòng)駕駛模型”(EMMA)。
    的頭像 發(fā)表于 10-31 16:55 ?1619次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列模型更是其重要
    的頭像 發(fā)表于 10-29 11:02 ?1094次閱讀

    什么是大模型?快速了解大模型基本概念

    “在人工智能的世界里,大模型就像超級(jí)大腦一樣,能夠處理和理解大量的信息。你可能聽(tīng)說(shuō)過(guò)ChatGPT,它就是大模型的一個(gè)典型代表。那么,什么是大模型
    的頭像 發(fā)表于 08-07 08:28 ?2631次閱讀
    什么是大<b class='flag-5'>模型</b>?快速了解大<b class='flag-5'>模型</b>基本概念

    谷歌獲Character.AI大模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱

    8月5日最新資訊,創(chuàng)新企業(yè)Character.AI在上周五正式宣布,他們已經(jīng)與科技巨頭谷歌的母公司Alphabet達(dá)成了一項(xiàng)重要合作,非獨(dú)家授權(quán)谷歌使用其先進(jìn)的大型語(yǔ)言模型技術(shù)。此次合作不僅標(biāo)志著雙方在人工智能領(lǐng)域的深度合作,也
    的頭像 發(fā)表于 08-05 14:35 ?711次閱讀

    谷歌發(fā)布新型大語(yǔ)言模型Gemma 2

    在人工智能領(lǐng)域,大語(yǔ)言模型一直是研究的熱點(diǎn)。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開(kāi)發(fā)人員,正式發(fā)布了其最新研發(fā)的大語(yǔ)言模型——Gemma 2。這款模型以其高效能和低成本的特點(diǎn)
    的頭像 發(fā)表于 06-29 09:48 ?704次閱讀
    主站蜘蛛池模板: 久青草国产免费观看 | 最刺激黄a大片免费观看 | 天天艹天天 | 夜夜爽天天干 | 午夜在线免费观看 | 欧美ol丝袜高跟秘书在线观看 | 色综合久久98天天综合 | 午夜污片 | 伊人久久大香线蕉观看 | 久久久美女视频 | 91免费网站在线看入口黄 | 五月天婷婷在线观看视频 | 亚洲精品卡1卡二卡3卡四卡 | 另类毛片| 成人夜夜嗨 | 加勒比在线免费视频 | 亚洲第一区精品日韩在线播放 | 亚洲一区在线视频观看 | 黄 色 毛片免费 | 欧美成人午夜不卡在线视频 | 五月激情综合丁香色婷婷 | 亚洲欧美成人 | 亚洲爱爱图片 | 特色一级黄色片 | 天天爱天天做久久天天狠狼 | 午夜久| 中文字幕第五页 | 黄色网络在线观看 | 日日操操干干 | 美女牲交视频一级毛片 | 国产精品美乳在线观看 | 一 级 黄 色 片生活片 | 中文字幕人成不卡一区 | 有坂深雪在线 | 日本一卡精品视频免费 | 国产日本特黄特色大片免费视频 | 婷婷色香| 天天噜天天干 | 五月婷婷亚洲综合 | 久草男人天堂 | 日本免费人成黄页网观看视频 |