在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Reaver在《星際爭霸 II》各種小型游戲上與其他AI的性能對比

DPVg_AI_era ? 來源:未知 ? 2018-11-29 09:43 ? 次閱讀

如果說我們的征途是星辰大海,那么星際爭霸必定是其中一關。今天,有人在Github開源了他潛心研究一年半的成果,一個新手和資深研究人員都能受益的深度強化學習框架,單機運行速度快、方便調式,支持多種強化學習訓練環境。

上周結束的 AI Challenger 星際爭霸競賽,讓 AI 挑戰星際爭霸這個議題又稍稍火了一把。雖然這屆冠軍使用的仍然是硬編碼方法,但從其他解決方案中不難看出,AI算法的占比在不斷提升。

作為圍棋之后 DeepMind 公開宣布的下一個攻克目標,《星際爭霸》的魅力可見一斑。而隨后不久 DeepMind 便將其相關研究及平臺開源,更是印證了讓 AI 玩星際爭霸的挑戰。

今天,塔爾圖大學的 Roman Ring 在 Github 上開源了他傾力投入一年半的成果,一個名叫 Reaver 的《星際爭霸 II》AI,可用于訓練《星際爭霸 II》的各種基本任務。

Reaver 的基本思路是沿著 DeepMind 的路線在走,也即 AI 的玩法是像人類玩家一樣,從游戲畫面中獲取視覺特征,然后再做出決策。

補充說明,Roman 去年本科畢業項目是使用《Actor-Critic 法復現 DeepMind 星際爭霸 II 強化學習基準》[1],Reaver 則是在此基礎上的改善提升。

Reaver 的強項在于比其他開源的同類框架單機運行速度快;除了支持星際爭霸游戲訓練環境 SC2LE,也支持 OpenAI Gym、ATARI 和 MUJOCO;模塊化組成,容易調試。

根據作者所說,Reaver 不到10 秒就解決 CartPole-v0,在 4 核 CPU 筆記本上每秒處理 5000 張圖像,使用 Google Colab,Reaver 通關《星際爭霸 II》SC2LE 小型游戲 MoveToBeacon 只需要半小時的時間。

Reaver 玩《星際爭霸 II》小型游戲 MoveToBeacon 的畫面,左邊是未經訓練,右邊是訓練后的情況。來源:Roman Ring/YouTube

套用一句話,如果我們的征途是星辰大海,那么其中的一關必然是《星際爭霸》。

Reaver 對于不具備 GPU 集群的人非常友好,正如作者在 Github 庫里介紹所說,

“雖然開發是研究驅動的,但 Reaver API 背后的理念類似于《星際爭霸II》游戲本身——新手可以用,領域專家也能從中獲得東西。

“對于業余愛好者而言,只要對 Reaver 稍作修改(例如超參數),就能得到訓練深度強化學習智能體的所有必須工具。對于經驗豐富的研究人員,Reaver 提供簡單但性能優化的代碼庫,而且都是模塊化架構:智能體、模型和環境都是分開,并且可以隨意組合調換。”

歡迎加入星際爭霸強化學習陣營。

深度強化學習AIReaver:模塊化且便于調試

性能 大部分已發表的強化學習基準通常針對的都是 MPI 之間 message-based 通信,對于 DeepMind 或者 OpenAI 這樣有大規模分布式強化學習配置的機構而言這樣做自然很合理,但對于普通研究者或其他沒有這類強大基礎設施的人,這就成了很大的瓶頸。因此,Roman Ring 采用了共享內存(shared memory)的方法,相比 message-based 并行的解決方案實現了大約 3 倍的速度提升。

模塊化 很多強化學習基準都或多或少都是模塊化的,不過這些基準通常與作者使用的訓練環境密切相關。Roman Ring 自己就曾經因為專注于《星際爭霸 II》環境而導致調試花了很長時間。因此,Revar 只需要一個命令行就能改變訓練環境,從 SC2 到 Atari 或者 CartPole(將來計劃納入 VizDoom)。每個神經網絡都是簡單的 Keras 模型,只要符合基本的 API contracts 都能調用。

調試 現在一個游戲 AI 通常含有十幾個不同的調試參數,如何實現更為統一便捷的調試?Roman Ring 在 Reaver 中只要能用的地方都用了 “gin-config”,這個輕量級調試框架只要是 Python 可調用函數都能調試,非常方便。

更新 是的,現在算法發展很快,去年發表的東西今年就可能過時。在開發 Reaver 的時候 Roman 表示他想著用了 TensorFlow 2.0 API(主要是使用 tf.keras 不用 tf.contrib),希望這個庫能活用久一點吧。

單機友好,可用于訓練星際爭霸II各種任務

Roman Ring 列出了 Reaver 在《星際爭霸 II》各種小型游戲上與其他 AI 的性能對比。其中,

Reaver(A2C)就是在 SC2LE 訓練 Reaver 得到的結果

DeepMind SC2LE 是 DeepMind 在《StarCraft II: A New Challenge for Reinforcement Learning》一文中發布的結果[2]

DeepMind ReDRL 則是 DeepMind 在《Relational Deep Reinforcement Learning》中的結果[3]

人類專家是 DeepMind 收集的 GrandMaster 級別人類玩家的結果

以下是 Reaver 在不同小型游戲中訓練花費的時間:

綜上,就算 DefeatRoaches 花了 150 小時,但考慮到硬件只是一臺筆記本(英特爾酷睿 i5-7300HQ,4核 +GTX 1050GPU),這個結果已經算很不錯。

Roman 還列出了他的路線圖,上述成果只是他萬里長征的第一步。如果你感興趣,不妨加入這個項目。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 強化學習
    +關注

    關注

    4

    文章

    268

    瀏覽量

    11305
  • GitHub
    +關注

    關注

    3

    文章

    473

    瀏覽量

    16586
  • AI算法
    +關注

    關注

    0

    文章

    252

    瀏覽量

    12345

原文標題:單機《星際爭霸2》AI,不用GPU集群,支持多種訓練環境

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    汽輪機與其他動力設備的對比

    現代工業中,動力設備是不可或缺的組成部分,它們為各種工業過程提供必要的能量。汽輪機作為一種高效的能量轉換設備,與其他動力設備相比,具有其獨特的優勢和局限性。 汽輪機的特點 汽輪機的主要特點包括
    的頭像 發表于 02-06 16:58 ?157次閱讀

    真空斷路器與其他類型斷路器的性能對比

    電力系統中,斷路器是實現電路控制和保護的關鍵設備。隨著技術的發展,斷路器的種類也越來越多,包括真空斷路器、空氣斷路器、油斷路器和SF6斷路器等。每種類型的斷路器都有其特定的應用場景和性能特點
    的頭像 發表于 01-17 09:39 ?162次閱讀

    HarmonyOS NEXT 應用開發練習:AI能對話框

    顯示發送的時間戳,以便用戶了解消息的發送時間。 這個DEMO展示了如何使用ArkTS和擴展后的ChatUI框架(或類似功能的庫)HarmonyOS NEXT創建一個功能豐富的AI能對
    發表于 01-03 11:29

    華為云Flexus X實例,Redis性能加速評測及對比

    加速 Redis 的選項。本文旨在通過實際測試,展示華為云 Flexus X 實例加速 Redis 方面的性能優勢,并與其他業界 U1 實例進行對比
    的頭像 發表于 12-29 15:47 ?215次閱讀
    華為云Flexus X實例,Redis<b class='flag-5'>性能</b>加速評測及<b class='flag-5'>對比</b>

    ddc與其他分類系統的比較

    DDC(Dewey Decimal Classification,即杜威十進制分類法)與其他分類系統多個方面存在差異。以下是對DDC與其他分類系統(如體系分類法、網絡分類體系、PLC控制系統分類等
    的頭像 發表于 12-18 15:10 ?341次閱讀

    TNC連接器對比分析:與其他射頻連接器的性能對

    德索工程師說道射頻連接器領域,TNC連接器以其卓越的性能和廣泛的應用而著稱。以下是TNC連接器與其他射頻連接器的性能對比分析: TNC連接器vs SMA連接器 頻率范圍:TNC連
    的頭像 發表于 12-17 10:58 ?284次閱讀
    TNC連接器<b class='flag-5'>對比</b>分析:<b class='flag-5'>與其他</b>射頻連接器的<b class='flag-5'>性能對</b>決

    可控硅與其他半導體器件的對比

    可控硅與其他半導體器件的對比如下: 一、可控硅與IGBT的對比 結構 : 可控硅:一種由NPNPN結構組成的多層PN結的器件,通常由四個電極組成,即門極(G)、陽極(A)、陰極(K)和螺旋線圈(C
    的頭像 發表于 12-04 10:47 ?453次閱讀

    NPU與GPU的性能對比

    它們不同應用場景下的表現。 一、設計初衷與優化方向 NPU : 專為加速AI任務而設計,包括深度學習和推理。 針對神經網絡的計算模式進行了優化,能夠高效地執行矩陣乘法、卷積等操作。 擁有眾多小型處理單元,配備專門的內存體系結構
    的頭像 發表于 11-14 15:19 ?1960次閱讀

    Orin芯片與其他芯片對比

    。 1. 性能對比 Orin芯片: 核心數量: Orin芯片擁有高達2048個CUDA核心,這為其提供了強大的圖形處理能力。 AI性能: 根據NVIDIA的數據,Orin的AI
    的頭像 發表于 10-27 15:42 ?1567次閱讀

    Llama 3 模型與其他AI工具對比

    Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術架構、性能表現、應用場景、定制化能力、開源與成本等方面。以下是對Llama 3模型
    的頭像 發表于 10-27 14:37 ?523次閱讀

    Chip天線相比較其他天線的優勢有哪些?

    hello小伙伴們,上周我們推出了Chip天線的文,這種天線因其小型化、高性能和易于集成的特點,能夠各種使用環境下保持優異的性能。 Chi
    的頭像 發表于 08-30 09:07 ?412次閱讀
    Chip天線相比較<b class='flag-5'>其他</b>天線的優勢有哪些?

    PLC如何與其他設備進行通信

    工業自動化領域中,PLC(Programmable Logic Controller,可編程邏輯控制器)扮演著至關重要的角色。作為工業自動化系統的核心,PLC不僅負責控制設備的運行,還需要與其他
    的頭像 發表于 06-27 14:07 ?2224次閱讀

    ICL5101與ICL5102性能對比

    ICL5101與ICL5102性能對比-中文
    發表于 06-17 14:26 ?1次下載

    三星電容與其他品牌電容的對比優勢是什么?

    三星電容與其他品牌電容相比,具有一些顯著的優勢,以下是一些主要的對比優勢: 1、優秀的絕緣性能:三星電容具有出色的絕緣性能,這有助于減少漏電現象,提高電路的安全性和穩定性。
    的頭像 發表于 05-06 16:04 ?616次閱讀
    三星電容<b class='flag-5'>與其他</b>品牌電容的<b class='flag-5'>對比</b>優勢是什么?

    逆變直流點焊機與其他類型點焊機對比研究

    點焊機作為現代工業生產中不可或缺的焊接設備,其類型多樣,性能各異。逆變直流點焊機以其高效、穩定、節能的特點,焊接領域中逐漸占據重要地位。本文比斯特自動化小編將對逆變直流點焊機與其他類型點焊機進行
    的頭像 發表于 04-22 09:29 ?802次閱讀
    主站蜘蛛池模板: 久久综合九色综合精品 | 四虎在线永久视频观看 | 激情文学综合 | 月夜免费观看高清在线完整 | 麒麟色欧美影院在线播放 | 天堂网在线最新版官网 | 亚洲国产福利 | 国产精品www视频免费看 | 在线天堂中文在线网 | 99草在线视频 | 国产裸体美女视频全黄 | 99热最新网址 | 每日最新avhd101天天看新片 | 国产一卡2卡3卡四卡精品网站 | 人人草人人射 | 97久久天天综合色天天综合色 | 免费一级毛片视频 | 夜夜爱夜夜操 | 好硬好湿好爽再深一点h视频 | 天天色综合社区 | 最新国产在线播放 | 乱色伦短篇小说 | 久久青草免费免费91线频观看 | 伊人成伊人成综合网2222 | 天天摸天天碰成人免费视频 | 欧美视频亚洲色图 | 久久网站免费 | 日本不卡视频 | 日本大片免a费观看在线 | 久久夜色精品国产噜噜 | 每日最新avhd101天天看新片 | 特级毛片免费视频 | 俺来也俺来也天天夜夜视频 | 欧美黄色录像 | 日韩三| 免费一级黄 | 狠狠操狠狠摸 | jiucao在线观看精品 | 欧美日韩在线成人免费 | 91综合网 | 日本免费观看网站 |