91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于最近將深度強化學習應用于迷宮導航的研究

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-04-08 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在每個人的童年時期,我們是如何學會記住自己家附近的路的?我們是怎樣學會自己去朋友家、學校或者去小賣部的?在沒有地圖的情況下,我們可能只是簡單地記住了某條路長什么樣,憑記憶引導自己。慢慢地,我們逐漸熟悉了自己的日常活動范圍,就變得有信心了,能知道自己身在何處,并且學習了新的更復雜的道路。偶爾你可能會迷路,但是憑借某個標志甚至太陽你又能找到正確的路。

在非結構化的環境中導航是智能生物的特有的功能,想要實現遠程導航,首先要對空間進行內部探索,然后要識別地標,同時還要有強大的視覺處理能力。基于最近將深度強化學習應用于迷宮導航的研究,DeepMind的研究人員也提出了一種端到端的深度強化學習方法,他們讓智能體在真實的城市空間中導航,無需地圖,并且這種方法還能遷移到不同城市環境。

導航是一項重要的認知任務,它能讓人類和動物在沒有地圖的情況下,穿越過一片阡陌縱橫的區域。這種遠距離導航可以同時進行自我定位(我在這里)和目標表示(我要去那里)。

在Learning to Navigate in Cities Without a Map這篇論文里,我們展示了一種交互式導航環境,利用第一人稱視角的谷歌街景照片做素材,將其游戲化以訓練AI。標準的街景照片,人臉和車牌都被模糊,無法識別。我們建立了一個基于神經網絡的智能體,學習使用視覺信息在多個城市中導航。注意,這項研究關注的是一般導航,而非駕駛導航;我們沒有使用交通信息,也沒有對車輛控制進行建模。

數據來源于真實街景。從左至右分別為紐約時代廣場、中央公園和倫敦圣保羅大教堂

當智能體達到目的地時,它就會獲得獎勵(具體來說是一個經緯度坐標),就像一個沒有地圖的郵遞員,要送無數的快遞。隨著時間的發展,智能體慢慢學會了用這種方法穿越整個城市。我們同樣證明了智能體可以學習多個城市的道路,并且這種學習方法能有效遷移到新的城市中。

在沒有地圖的情況下學習導航

我們不使用傳統的依賴外部映射和探索的傳統方法,而是讓智能體學習像人類一樣導航,不用地圖、GPS定位或其他輔助工具,只用視覺觀察。我們創建了一個神經網絡智能體,向其中輸入在環境中觀察到的圖像,并預測它在該環境中執行的下一項操作。我們使用深度強化學習對其進行端到端訓練,類似最近讓智能體在復雜的3D迷宮中學習導航的研究,以及用無監督輔助方法玩游戲。與迷宮不同,我們利用真實的城市數據,例如倫敦、巴黎和紐約的復雜交叉路口、人行道、隧道和各種城市道路。此外,我們使用的方法可以遷移到不同城市,并可以優化導航行為。

模塊化神經網絡

我們智能體的神經網絡包括三個部分:

能夠處理圖像并提取視覺特征的卷積網絡;

一個特定場所的循環神經網絡,在內部進行對環境的記憶并學習表示“這里”(智能體的當前位置)和“那里”(目標位置);

一個位置不變的循環網絡,能夠根據智能體位置的變化進行導航。

特定場所的模塊被設計成可互換的,并且正如其名,對于每個城市都是唯一的,而視覺模塊和策略模塊是不隨著場景而變換的。

就像谷歌街景的界面一樣,智能體可以在原地打轉,也可以向前進入到下一個場景。但與谷歌地圖和街景不同的是,智能體看不到小箭頭、局部或全景地圖以及標志性的街景小人,它還需要學習區分開放道路和人行道。目的地可能是幾公里以外的地方,智能體需要搜索幾百個全景圖才能到達。

我們證明了這種方法能提供一種機制,將導航知識遷移到新城市中。和人類一樣,當智能體來到一個新城市,我們會希望它學習一組新的地標,但不必重新學習它的視覺表現或行為(例如,沿著街道向前縮放,或者在交叉路口轉向)。因此,使用MultiCity架構,我們在許多城市進行首次訓練,然后凍結策略網絡和視覺卷積網絡,并在一個新城市中建立唯一一個新的特定地區路徑。這種方法讓智能體在獲取新知識的同時不忘之前學到的東西,類似漸進式神經網絡架構。

學習導航是人工智能領域的基礎,試圖在智能體中復制導航功能還可以幫助科學家了解其生物學基礎。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103663
  • 導航
    +關注

    關注

    7

    文章

    555

    瀏覽量

    43169
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249614

原文標題:無需地圖,DeepMind讓智能體在城市中自我導航

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Isaac Lab可用環境與強化學習腳本使用指南

    Lab 是一個適用于機器人學習的開源模塊化框架,其模塊化高保真仿真適用于各種訓練環境,Isaac Lab 同時支持模仿學習(模仿人類)和強化學習
    的頭像 發表于 07-14 15:29 ?571次閱讀
    NVIDIA Isaac Lab可用環境與<b class='flag-5'>強化學習</b>腳本使用指南

    18個常用的強化學習算法整理:從基礎方法到高級模型的理論技術與代碼實現

    本來轉自:DeepHubIMBA本文系統講解從基本強化學習方法到高級技術(如PPO、A3C、PlaNet等)的實現原理與編碼過程,旨在通過理論結合代碼的方式,構建對強化學習算法的全面理解。為確保內容
    的頭像 發表于 04-23 13:22 ?421次閱讀
    18個常用的<b class='flag-5'>強化學習</b>算法整理:從基礎方法到高級模型的理論技術與代碼實現

    詳解RAD端到端強化學習后訓練范式

    受限于算力和數據,大語言模型預訓練的 scalinglaw 已經趨近于極限。DeepSeekR1/OpenAl01通過強化學習后訓練涌現了強大的推理能力,掀起新一輪技術革新。
    的頭像 發表于 02-25 14:06 ?602次閱讀
    詳解RAD端到端<b class='flag-5'>強化學習</b>后訓練范式

    淺談適用規模充電站的深度學習有序充電策略

    深度強化學習能夠有效計及電動汽車出行模式和充電需求的不確定性,實現充電場站充電成本化的目標。通過對電動汽車泊車時間和充電需求特征進行提取,建立適用于大規模電動汽車有序充電的馬爾可夫決策過程模型,并
    的頭像 發表于 02-08 15:00 ?541次閱讀
    淺談適用規模充電站的<b class='flag-5'>深度</b><b class='flag-5'>學習</b>有序充電策略

    OpenAI發布深度研究智能體功能

    OpenAI的o3模型提供支持,通過端到端的強化學習訓練,實現了高效、準確的研究能力。它能夠在5-30分鐘內完成一份專業報告,大大縮短了研究時間,提高了研究效率。 該功能由四個模塊協同
    的頭像 發表于 02-05 15:05 ?567次閱讀

    如何在化學和材料科學領域開展有影響力的人工智能研究?(三)

    第三部分編譯后的內容:4.如何解決科學問題?在掌握了上述的工具和視角后,我們提出一些建議,幫助您在化學領域選擇具有影響力的研究課題,并介紹機器學習問題的高層次結構。最后,我們
    的頭像 發表于 12-03 01:02 ?496次閱讀
    如何在<b class='flag-5'>化學</b>和材料科學領域開展有影響力的人工智能<b class='flag-5'>研究</b>?(三)

    如何在化學和材料科學領域開展有影響力的人工智能研究?(二)

    第二部分編譯后的內容:3.問題遇見方法:從機器學習的視角去解決化學問題的方法在機器學習的具體內容應用于實踐中的過程中,有大量可供參考的資源
    的頭像 發表于 12-03 01:02 ?528次閱讀
    如何在<b class='flag-5'>化學</b>和材料科學領域開展有影響力的人工智能<b class='flag-5'>研究</b>?(二)

    螞蟻集團收購邊塞科技,吳翼出任強化學習實驗室首席科學家

    領域的研究與發展。令人矚目的是,邊塞科技的創始人吳翼已正式加入該實驗室,并擔任首席科學家一職。 吳翼在其個人社交平臺上對這一變動進行了回應。他表示,自己最近接受了螞蟻集團的邀請,負責大模型強化學習領域的
    的頭像 發表于 11-22 11:14 ?1586次閱讀

    淺談適用于大規模充電場站的深度強化學習有序充電策略

    隨著新能源汽車銷量的快速增長,大規模充電場站的建設需求日益凸顯。據乘聯會銷量數據顯示,2017年中國新能源乘用車銷量達到了57.6萬臺,位列全球,且保持著較高的增長率。中國汽車工業協會預計,2018年新能源汽車銷量超過100萬輛。然而,大規模充電場站面臨著諸多挑戰。
    的頭像 發表于 11-13 10:55 ?664次閱讀
    淺談適<b class='flag-5'>用于</b>大規模充電場站的<b class='flag-5'>深度</b><b class='flag-5'>強化學習</b>有序充電策略

    如何使用 PyTorch 進行強化學習

    強化學習(Reinforcement Learning, RL)是一種機器學習方法,它通過與環境的交互來學習如何做出決策,以最大化累積獎勵。PyTorch 是一個流行的開源機器學習庫,
    的頭像 發表于 11-05 17:34 ?1045次閱讀

    基于深度學習的三維點云分類方法

    近年來,點云表示已成為計算機視覺領域的研究熱點之一,并廣泛應用于自動駕駛、虛擬現實、機器人等許多領域。雖然深度學習技術在處理常規結構化的二維網格圖像數據方面取得了巨大成功,但在處理不規
    的頭像 發表于 10-29 09:43 ?1585次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的三維點云分類方法

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發表于 10-27 11:13 ?1384次閱讀

    TI TSC應用于各種和多種功能

    電子發燒友網站提供《TI TSC應用于各種和多種功能.pdf》資料免費下載
    發表于 10-22 10:15 ?0次下載
    <b class='flag-5'>將</b>TI TSC<b class='flag-5'>應用于</b>各種和多種功能

    谷歌AlphaChip強化學習工具發布,聯發科天璣芯片率先采用

    近日,谷歌在芯片設計領域取得了重要突破,詳細介紹了其用于芯片設計布局的強化學習方法,并將該模型命名為“AlphaChip”。據悉,AlphaChip有望顯著加速芯片布局規劃的設計流程,并幫助芯片在性能、功耗和面積方面實現更優表現。
    的頭像 發表于 09-30 16:16 ?705次閱讀

    FPGA做深度學習能走多遠?

    ,FPGA 也需要不斷適應和改進。研究人員和開發者致力于針對 FPGA 的特點對深度學習算法進行優化,例如探索更高效的模型壓縮方法、量化技術以及硬件友好的算法結構等,以進一步提高 F
    發表于 09-27 20:53
    主站蜘蛛池模板: 80s国产成年女人毛片 | 在线播放亚洲视频 | 狠狠干欧美 | 男人资源在线 | 五月天婷婷电影 | 午夜剧场一级片 | 一级女性黄 色生活片 | 亚洲 欧美 丝袜 制服 在线 | 中文字幕在线看精品乱码 | 欧美网站在线播放 | 美女毛片视频 | 男人女人的免费视频网站 | 五月婷婷婷婷婷 | 国产无套粉嫩白浆 | 国产在线高清精品二区色五郎 | 精品久久久久久久久久 | 在线天堂中文在线资源网 | 人人插视频 | 国产精品福利午夜在线观看 | www在线播放 | 国产天天在线 | 三级视频网站在线观看 | 免费啪视频在线观看 | 夜性影院| 人人狠狠综合88综合久久 | 国产成人a毛片 | 4438成人成人高清视频 | 精品国产免费久久久久久婷婷 | 天天做天天添天天谢 | 日韩爽片| 免费人成在线观看视频播放 | 激情综合亚洲 | 狠狠狠色丁香婷婷综合激情 | 欧美色图亚洲综合 | 日干夜操| 亚洲swag精品自拍一区 | 中年艳妇乱小玩 | 美女无遮挡拍拍拍免费视频 | 68日本 xxxxxxxxx| 伦理片第一页 | 国产成人午夜精品影院游乐网 |