在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind部署自學AI 攻陷FPS“雷神之錘”

電子工程師 ? 來源:yxw ? 2019-06-02 10:25 ? 次閱讀

AI攻占了國際象棋和圍棋高地之后,DeepMind在第一人稱射擊游戲(FPS)上也有了新進展。

1997年5月“深藍”擊敗國際象棋世界冠軍卡斯巴羅夫,有玩家在慶幸,我不下象棋,只下圍棋。

2017年5月AlphaGo打敗圍棋世界冠軍柯潔,有玩家慶幸,還好,我不下棋。

2018年6月,OpenAI 人工智能在dota2 5V5模式中以4000分水平擊敗人類玩家,依舊有玩家慶幸,我不玩RPG(角色扮演)對戰,我只玩FPS(第一人稱射擊)。

如今,FPS也被AI攻陷。

近日,DeepMind的研究人員在本周的《科學》雜志上發表了一篇論文,描述描述了一個完全無監督的自學程序,不僅能夠學習如何玩“ Quake III Arena ”(雷神之錘III競技場,一款第一人稱射擊游戲),還能設計出勝過人類團隊的新穎戰略。

國際象棋和圍棋最初是用來模擬戰爭游戲的,但卻對戰爭復盤的不好。因為這類游戲通常涉及一個或多個隊友和敵人。而且一個優秀的戰爭游戲必然是三維展開。

DeepMind使用的AI叫For The Win(FTW),本質是用卷積神經網絡直接通過屏幕上進行訓練,屏幕數據會被傳遞到兩個LSTM網絡或能夠學習長期依賴性的網絡。這兩個LSTM一個是在快速時間尺度上,另一個是在慢速時間尺度上運行。它們通過目標耦合,能夠對游戲世界進行預測并通過模擬游戲控制器輸出動作。

FTW總共訓練了30個游戲角色,為他們提供了一系列隊友和對手,并隨機選擇游戲階段,以防止他們通過記憶慣性做出選擇。每個角色都明確自己的獎勵信號,從而擁有自己獨特的目標(比如奪取旗幟)。此外,他們利用雙層流程(two-tier process)來優化內部獎勵,通過這些獎勵加強學習,來制定最重要的游戲策略。每個角色都單獨玩了大約450,000場比賽,相當于擁有大約四年的經驗。

訓練過后的FTW在地圖,團隊名單和團隊規模選擇方面都可以作出有利的選擇。他們學習了類似人類的行為,例如跟隨隊友,在對手的基地露營,以及在一波攻擊中捍衛他們自己的基地。而隨著訓練的進行,他們還學會避免人類玩家的一些弱點,比如過于關注隊友的行為。

在一場有40名人類參加的比賽中,人類和AI在比賽中隨機匹配(對手或隊友),結果,AI大勝人類玩家,FTW的Elo評級(相當于獲勝的概率)為1600,而最好的人類玩家也只有1300,人類玩家平均評級為1050。

倫敦全球大學計算機科學教授,DeepMind科學家Thore Graepel表示,這項工作顯示了多智能體培訓(multiagent)推動人工智能發展的潛力。這是人機交互和系統相互補充或協同工作的研究的一個重大進步。

AI訓練思路

游戲分為兩個陣營,兩方的大本營在游戲時候開會隨機設置在地圖的兩端。游戲中的玩家可以在游戲地圖中“瞎逛”,借助地圖中的建筑物、數目以及其他物品與玩家進行互動。

在游戲中,如果一方用激光擊敗了其他玩家,被擊中的玩家丟掉旗幟,回大本營重生。

DeepMind采用的AI玩家會和人類有同樣的視角,AI不知道其他玩家的信息,包括位置、狀態等。另外這款游戲比其他棋牌游戲更能接近真實的戰場。AI玩家從零開始,用強化學習訓練,在游戲的開始,真實加入戰場的AI角色是隨機選擇的,這會使得智能體的行為更能接近最初設置的策略目標。

每個智能體都能夠為自己制定策略,這意味著不同角色會采用不同的戰術,即不同AI玩家有不同的專攻方向。

當然,也會有限制,即在每1000次迭代后,系統會比較策略并評估整個團隊在模仿與學習能力。如果一個智能體的獲勝機會低于另一個智能體的70%,那么較弱的智能體會復制較強的智能體。同時,強化學習還要求AI通過其他指標的對比進行調整。

AI玩家在一開始就像一張白紙,研究人員給他們的目標不僅是游戲結束時候的得分,還要關注在游戲前期的得分。研究人員指出,如果獎勵機制只和游戲結果有關(輸/贏/平局),顯然限制太少,導致學習效果非常不好,所以需要考慮動態的獎勵機制,即根據游戲的點數流來變動。

當初始位置是隨機生成時,AI通常擊敗人類玩家。即使人類已經練習了12個小時,他們仍然能夠贏得25%的比賽,平局6%,剩下的是負。

然而,當兩名職業游戲測試人員得到一張特別復雜的地圖時,這張地圖AI并沒有見過。重新讓AI在這張地圖上訓練的話,只需要6個小時的訓練就能脫穎而出。

這一結果沒有在論文說明,而是在向新聞界提供的一份補充文件中作了說明。

目前人們仍然可以在經過精心設計的定位戰中擊敗AI,因為現實生活很少提供這樣復盤重來的機會,畢竟淮海戰役只能打一次!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34589

    瀏覽量

    276236
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    11437

原文標題:Science最新:DeepMind部署自學AI,攻陷FPS“雷神之錘”

文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    STM32F769是否可以部署邊緣AI

    STM32F769是否可以部署邊緣AI
    發表于 06-17 06:44

    企業部署AI大模型怎么做

    當下,AI大模型已成為驅動決策自動化、服務智能化與產品創新的核心引擎。然而,企業面對動輒數百億參數的大模型部署時,常陷入算力不足、響應延遲高、成本失控等困境。如何突破瓶頸,實現高效、穩定的AI
    的頭像 發表于 06-04 09:26 ?126次閱讀

    RAKsmart服務器如何賦能AI開發與部署

    AI開發與部署的復雜性不僅體現在算法設計層面,更依賴于底層基礎設施的支撐能力。RAKsmart服務器憑借其高性能硬件架構、靈活的資源調度能力以及面向AI場景的深度優化,正在成為企業突破算力瓶頸、加速
    的頭像 發表于 04-30 09:22 ?206次閱讀

    Deepseek海思SD3403邊緣計算AI產品系統

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產品工具包,解決客戶低成本AI系統,針對差異化AI 應用場景,自己采集樣本數據,進行AI
    發表于 04-28 11:05

    AI端側部署案例(SC171開發套件V3)

    AI端側部署案例(SC171開發套件V3) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 初學者入門手寫數字識別案例 20分02秒 https://t.elecfans.com
    發表于 04-16 18:33

    AI端側部署開發(SC171開發套件V3)

    AI端側部署開發(SC171開發套件V3) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉化指南------Docker Desktop環境操作
    發表于 04-16 18:30

    AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫

    繼續學習迪哥的AI Agent入門引導書籍。 LLM在落地應用中面臨著專業領域表現不足、知識更新困難、容易產生\"幻覺\"等問題,這些挑戰嚴重制約了AI技術在各行業的深入
    發表于 03-07 19:49

    DeepMind創始人預計年內有AI設計藥物進入臨床試驗

    近日,英國人工智能公司DeepMind的創始人兼首席執行官德米斯·哈薩比斯(Demis Hassabis)透露,預計在今年年底前,將有人工智能(AI)設計的藥物進入臨床試驗階段。
    的頭像 發表于 01-24 15:46 ?2134次閱讀

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露,谷歌已將AI Studio團隊整體轉移至DeepMi
    的頭像 發表于 01-13 14:40 ?653次閱讀

    企業AI模型部署攻略

    當下,越來越多的企業開始探索和實施AI模型,以提升業務效率和競爭力。然而,AI模型的部署并非易事,需要企業在多個層面進行細致的規劃和準備。下面,AI部落小編為企業提供一份
    的頭像 發表于 12-23 10:31 ?741次閱讀

    AI模型部署和管理的關系

    AI模型的部署與管理是AI項目成功的兩大支柱,它們之間既相互獨立又緊密相連,共同推動著AI技術從實驗室走向實際應用。
    的頭像 發表于 11-21 10:02 ?612次閱讀

    如何在STM32f4系列開發板上部署STM32Cube.AI

    已下載STM32Cube.AI擴展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經過開發板處理器進行AI模型處理識別過后,告訴我識別結果,顯示在TFL
    發表于 11-18 09:39

    華迅光通AI計算加速800G光模塊部署

    ,對人工智能服務器集群的需求也急劇上升。隨著數據中心基礎設施的不斷擴大,光模塊的使用量呈指數級增長。目前,200G和400G光模塊已經大規模部署,800G光模塊已經開始進入量產和引進階段。 為什么需要
    發表于 11-13 10:16

    企業AI模型部署怎么做

    AI模型部署作為這一轉型過程中的關鍵環節,其成功實施對于企業的長遠發展至關重要。在此,AI部落小編為您介紹企業AI模型部署的步驟以及注意事項
    的頭像 發表于 11-04 10:15 ?736次閱讀

    Arm推出GitHub平臺AI工具,簡化開發者AI應用開發部署流程

    專為 GitHub Copilot 設計的 Arm 擴展程序,可加速從云到邊緣側基于 Arm 平臺的開發。 Arm 原生運行器為部署云原生、Windows on Arm 以及云到邊緣側的 AI
    的頭像 發表于 10-31 18:51 ?3272次閱讀
    主站蜘蛛池模板: 一级特黄aaa大片在线观看 | 免看一级a毛片一片成人不卡 | 亚洲精品91香蕉综合区 | 日本天堂影院在线播放 | 综合久久99 | 口述他拿舌头进去我下面好爽 | 日韩中文电影 | 国产乱码1卡一卡二卡 | 成 黄 色 激 情视频网站 | 国产成人毛片视频不卡在线 | 久久99久久精品免费思思6 | 男女视频在线观看 | 日本综合视频 | 在线色国产 | 农村的毛片丨级 | 亚洲4区 | 午夜小视频在线播放 | 色婷五月综激情亚洲综合 | 亚洲精品视频在线看 | 日韩特黄 | 亚洲韩国在线一卡二卡 | 亚洲第一区二区快射影院 | 好色999 | 午夜精品在线视频 | 亚洲男人的天堂在线观看 | 亚欧美视频 | 天天夜夜人人 | 在线亚洲国产精品区 | 97一区二区三区 | 婷婷四房综合激情五月性色 | 寡妇影院首页亚洲图片 | 午夜网站免费版在线观看 | 99久久精品免费观看国产 | 97一本大道波多野吉衣 | 午夜婷婷网 | 国产精品久久久久久久久久妇女 | 天天摸夜班摸天天碰 | 亚洲色图图片专区 | 欧美性喷潮xxxx | 欧美一区二区三区四区在线观看 | 色四虎 |