在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind部署自學AI 攻陷FPS“雷神之錘”

電子工程師 ? 來源:yxw ? 2019-06-02 10:25 ? 次閱讀

AI攻占了國際象棋和圍棋高地之后,DeepMind在第一人稱射擊游戲(FPS)上也有了新進展。

1997年5月“深藍”擊敗國際象棋世界冠軍卡斯巴羅夫,有玩家在慶幸,我不下象棋,只下圍棋。

2017年5月AlphaGo打敗圍棋世界冠軍柯潔,有玩家慶幸,還好,我不下棋。

2018年6月,OpenAI 人工智能在dota2 5V5模式中以4000分水平擊敗人類玩家,依舊有玩家慶幸,我不玩RPG(角色扮演)對戰,我只玩FPS(第一人稱射擊)。

如今,FPS也被AI攻陷。

近日,DeepMind的研究人員在本周的《科學》雜志上發表了一篇論文,描述描述了一個完全無監督的自學程序,不僅能夠學習如何玩“ Quake III Arena ”(雷神之錘III競技場,一款第一人稱射擊游戲),還能設計出勝過人類團隊的新穎戰略。

國際象棋和圍棋最初是用來模擬戰爭游戲的,但卻對戰爭復盤的不好。因為這類游戲通常涉及一個或多個隊友和敵人。而且一個優秀的戰爭游戲必然是三維展開。

DeepMind使用的AI叫For The Win(FTW),本質是用卷積神經網絡直接通過屏幕上進行訓練,屏幕數據會被傳遞到兩個LSTM網絡或能夠學習長期依賴性的網絡。這兩個LSTM一個是在快速時間尺度上,另一個是在慢速時間尺度上運行。它們通過目標耦合,能夠對游戲世界進行預測并通過模擬游戲控制器輸出動作。

FTW總共訓練了30個游戲角色,為他們提供了一系列隊友和對手,并隨機選擇游戲階段,以防止他們通過記憶慣性做出選擇。每個角色都明確自己的獎勵信號,從而擁有自己獨特的目標(比如奪取旗幟)。此外,他們利用雙層流程(two-tier process)來優化內部獎勵,通過這些獎勵加強學習,來制定最重要的游戲策略。每個角色都單獨玩了大約450,000場比賽,相當于擁有大約四年的經驗。

訓練過后的FTW在地圖,團隊名單和團隊規模選擇方面都可以作出有利的選擇。他們學習了類似人類的行為,例如跟隨隊友,在對手的基地露營,以及在一波攻擊中捍衛他們自己的基地。而隨著訓練的進行,他們還學會避免人類玩家的一些弱點,比如過于關注隊友的行為。

在一場有40名人類參加的比賽中,人類和AI在比賽中隨機匹配(對手或隊友),結果,AI大勝人類玩家,FTW的Elo評級(相當于獲勝的概率)為1600,而最好的人類玩家也只有1300,人類玩家平均評級為1050。

倫敦全球大學計算機科學教授,DeepMind科學家Thore Graepel表示,這項工作顯示了多智能體培訓(multiagent)推動人工智能發展的潛力。這是人機交互和系統相互補充或協同工作的研究的一個重大進步。

AI訓練思路

游戲分為兩個陣營,兩方的大本營在游戲時候開會隨機設置在地圖的兩端。游戲中的玩家可以在游戲地圖中“瞎逛”,借助地圖中的建筑物、數目以及其他物品與玩家進行互動。

在游戲中,如果一方用激光擊敗了其他玩家,被擊中的玩家丟掉旗幟,回大本營重生。

DeepMind采用的AI玩家會和人類有同樣的視角,AI不知道其他玩家的信息,包括位置、狀態等。另外這款游戲比其他棋牌游戲更能接近真實的戰場。AI玩家從零開始,用強化學習訓練,在游戲的開始,真實加入戰場的AI角色是隨機選擇的,這會使得智能體的行為更能接近最初設置的策略目標。

每個智能體都能夠為自己制定策略,這意味著不同角色會采用不同的戰術,即不同AI玩家有不同的專攻方向。

當然,也會有限制,即在每1000次迭代后,系統會比較策略并評估整個團隊在模仿與學習能力。如果一個智能體的獲勝機會低于另一個智能體的70%,那么較弱的智能體會復制較強的智能體。同時,強化學習還要求AI通過其他指標的對比進行調整。

AI玩家在一開始就像一張白紙,研究人員給他們的目標不僅是游戲結束時候的得分,還要關注在游戲前期的得分。研究人員指出,如果獎勵機制只和游戲結果有關(輸/贏/平局),顯然限制太少,導致學習效果非常不好,所以需要考慮動態的獎勵機制,即根據游戲的點數流來變動。

當初始位置是隨機生成時,AI通常擊敗人類玩家。即使人類已經練習了12個小時,他們仍然能夠贏得25%的比賽,平局6%,剩下的是負。

然而,當兩名職業游戲測試人員得到一張特別復雜的地圖時,這張地圖AI并沒有見過。重新讓AI在這張地圖上訓練的話,只需要6個小時的訓練就能脫穎而出。

這一結果沒有在論文說明,而是在向新聞界提供的一份補充文件中作了說明。

目前人們仍然可以在經過精心設計的定位戰中擊敗AI,因為現實生活很少提供這樣復盤重來的機會,畢竟淮海戰役只能打一次!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31613

    瀏覽量

    270422
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    10949

原文標題:Science最新:DeepMind部署自學AI,攻陷FPS“雷神之錘”

文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    DeepMind創始人預計年內有AI設計藥物進入臨床試驗

    近日,英國人工智能公司DeepMind的創始人兼首席執行官德米斯·哈薩比斯(Demis Hassabis)透露,預計在今年年底前,將有人工智能(AI)設計的藥物進入臨床試驗階段。
    的頭像 發表于 01-24 15:46 ?1349次閱讀

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露,谷歌已將AI Studio團隊整體轉移至DeepMi
    的頭像 發表于 01-13 14:40 ?257次閱讀

    企業AI模型部署攻略

    當下,越來越多的企業開始探索和實施AI模型,以提升業務效率和競爭力。然而,AI模型的部署并非易事,需要企業在多個層面進行細致的規劃和準備。下面,AI部落小編為企業提供一份
    的頭像 發表于 12-23 10:31 ?183次閱讀

    AI模型部署和管理的關系

    AI模型的部署與管理是AI項目成功的兩大支柱,它們之間既相互獨立又緊密相連,共同推動著AI技術從實驗室走向實際應用。
    的頭像 發表于 11-21 10:02 ?221次閱讀

    如何在STM32f4系列開發板上部署STM32Cube.AI

    已下載STM32Cube.AI擴展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經過開發板處理器進行AI模型處理識別過后,告訴我識別結果,顯示在TFL
    發表于 11-18 09:39

    華迅光通AI計算加速800G光模塊部署

    ,對人工智能服務器集群的需求也急劇上升。隨著數據中心基礎設施的不斷擴大,光模塊的使用量呈指數級增長。目前,200G和400G光模塊已經大規模部署,800G光模塊已經開始進入量產和引進階段。 為什么需要
    發表于 11-13 10:16

    企業AI模型部署怎么做

    AI模型部署作為這一轉型過程中的關鍵環節,其成功實施對于企業的長遠發展至關重要。在此,AI部落小編為您介紹企業AI模型部署的步驟以及注意事項
    的頭像 發表于 11-04 10:15 ?206次閱讀

    Arm推出GitHub平臺AI工具,簡化開發者AI應用開發部署流程

    專為 GitHub Copilot 設計的 Arm 擴展程序,可加速從云到邊緣側基于 Arm 平臺的開發。 Arm 原生運行器為部署云原生、Windows on Arm 以及云到邊緣側的 AI
    的頭像 發表于 10-31 18:51 ?2907次閱讀

    Meta發布新AI模型自學評估器,探索減少人類參與度

    近日,Facebook母公司Meta正式發布了一批來自其研究部門的新AI模型,其中一款名為「自學評估器」(Self-Taught Evaluator)的模型尤為引人注目。該模型或將成為降低AI開發
    的頭像 發表于 10-23 13:44 ?342次閱讀

    谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發AI模型,這一創新技術將為科學家們提供前所未有的幫助,使他們能更精確地理解疾病機制,進而開發出更高效的治療藥物。
    的頭像 發表于 05-10 09:35 ?446次閱讀

    NVIDIA推出OVX存儲驗證計劃,加速AI部署

    隨著生成式AI的廣泛應用,全球企業正積極尋求提升業務創新的途徑。然而,復雜且耗時的IT基礎設施部署成為阻礙企業快速啟動AI工作負載的一大難題。
    的頭像 發表于 03-27 10:27 ?438次閱讀

    120fps能否成為VR眩暈的“關鍵門檻”?

    據悉,研究共招募了32位參與者,平均年齡介于18至51歲,男女比例均衡。每位參與者分別體驗了60fps、90fps、120fps及180fps Hz的畫面刷新率。實驗數據表明,120
    的頭像 發表于 03-18 15:36 ?864次閱讀

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌的DeepMind團隊發布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能體,能夠在多種3D虛擬環境
    的頭像 發表于 03-18 11:39 ?1063次閱讀

    使用CUBEAI部署tflite模型到STM32F0中,模型創建失敗怎么解決?

    看到CUBE_AI已經支持到STM32F0系列芯片,就想拿來入門嵌入式AI。 生成的模型很小,是可以部署到F0上的,但是一直無法創建成功。 查閱CUBE AI文檔說在調用create
    發表于 03-15 08:10

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據報道,谷歌公司的DeepMind團隊近期發布了AI模型Genie,此模型擁有多達110億個參數,能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。
    的頭像 發表于 02-27 14:53 ?852次閱讀
    主站蜘蛛池模板: 男女一级大黄 | 一级毛片在线 | 78摸在线| 亚洲福利视频一区二区 | 女人张开腿男人桶 | 日本高清视频网站www | 美女网站视频色 | 日韩三级在线免费观看 | 国产午夜亚洲精品 | 中国美女一级黄色片 | 男女一级特黄a大片 | 亚洲精品国产美女在线观看 | xxxx黄色| 免费网站毛片 | 国模鲍鱼 | 一区二区三区四区在线观看视频 | 狠狠色噜噜狠狠狠狠999米奇 | 精品国产自在现线看久久 | 国产美女久久久久 | 成人av在线播放 | 女人张开腿 让男人桶个爽 免费观看 | 美国69bj | 天天综合天天射 | 男人在线视频 | 色综合中文字幕 | 久久综合色区 | h网站在线免费观看 | 男女午夜剧场 | 久久影视免费体验区午夜啪啪 | 视频一区视频二区在线观看 | 国产成人影院在线观看 | 国产a三级三级三级 | 午夜手机视频 | 午夜美女写真福利写视频 | 欧美日韩国产乱了伦 | 美女扒开尿囗给男生桶爽 | 五月婷久久 | 免费网站在线视频美女被 | 免费看真人a一级毛片 | 国产手机在线国内精品 | 夜夜精品视频一区二区 |