歐洲的星際爭霸玩家們即日將有機會和Deepmind AI打場比賽了!
出戰的AI是由DeepMind和暴雪聯合培養的,經過了“特別的訓練方式”,在星際爭霸界 II 早有過赫赫戰績,連續在10場比賽中擊敗了人類職業選手。
其實,在今年年初的那次交鋒總共有11場比賽,只有全球直播現場交手那一次,由于比賽限制了AI的“視覺”能力,MaNa幫人類贏了一場。
另外10場比賽,代表人類出戰的是職業選手TLO和MaNa。兩位選手分別與AlphaStar打了五場。如果說與TLO對戰時AlphaStar還是萌新的話,那么與MaNa的對戰則完全顯示出了其戰術的老辣。畢竟,兩個比賽才相隔2周,AI 自學成才的能力已經初步顯示了可以超越人類極限的潛力。
AlphaStar VS TLO
那次輸給AI后,不少星際爭霸 II 的人類玩家都躍躍欲試,希望能親自挑戰AI,但只有少數職業玩家有權與AI對抗。
直到今天,星際爭霸官方發推表示,歐洲區星際爭霸 II 的玩家,將有機會在限定時間內與 DeepMind 的Alphastar人工智能對抗。
你的對手可能是只AI,而你毫不知情
作為正在進行的人工智能研究的一部分,DeepMind 星際爭霸 II 代理商 AlphaStar 的實驗版本很快將在歐洲競爭激烈的平臺上與人類玩家對抗。
在官方“戰書”中,Deepmind表示,如果你希望有機會和DeepMind 與 AlphaStar 打匹配,你可以點擊游戲內部彈出窗口上的"選擇加入"按鈕進行選擇。你可以隨時使用1v1 Versus 菜單上的"DeepMind opt-in"按鈕來改變你的選擇。
為了確保測試數據的真實,玩家不會被告知他們正在和阿爾法星人工智能對抗。因為當玩家知道自己在對抗AI時,他們的反應可能會有所不同。玩家可能會參與社區中所謂的"奶酪策略",而 AI 可能還沒有準備好。
從本質上講,"奶酪策略"是一種非常規的戰略,旨在讓對手措手不及。這些游戲不會被納入AlphaStar的訓練中,系統只能從人類回放和自我對戰中學習。
AlphaStar是如何訓練的?
DeepMind也在今天的博客中描述了AlphaStar的訓練方式。
AlphaStar是由一個深度神經網絡生成的,它接收來自原始游戲界面的輸入數據,并輸出一系列指令,構成游戲中的一個動作。更具體地說,神經網絡體系結構將transformer框架運用于模型單元(類似于關系深度強化學習),結合一個深度LSTM核心、一個帶有pointer network的自回歸策略前端和一個集中的值基線。這種先進的模型將有助于解決機器學習研究中涉及長期序列建模和大輸出空間(如翻譯、語言建模和視覺表示)的許多其他挑戰。
AlphaStar還使用了一種新的多智能體學習算法。該神經網絡最初是通過在Blizzard發布的匿名人類游戲中進行監督學習來訓練的。這使得AlphaStar能夠通過模仿學習星際爭霸上玩家所使用的基本微觀和宏觀策略。這個初級智能體在95%的游戲中擊敗了內置的“精英”AI關卡(相當于人類玩家的黃金級別)。
OMT: 知己知彼,百戰百勝?
最后,其實就在上周,一個由澳大利亞開發人員、機器學習工程師和研究人員組成的團隊——StarAi就基于星際爭霸的人機對抗開發了一個機器學習課程,并且在線免費發布,只用瀏覽器就能學!不如先去了解一下你的對手,再來試試看勝算有多大呀!
-
AI
+關注
關注
87文章
31613瀏覽量
270422 -
DeepMind
+關注
關注
0文章
131瀏覽量
10949
原文標題:DeepMind剛向星際爭霸 II 的玩家們下了戰書!你的對手可能是只AI,而你毫不知情
文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
OpenAI推進“星際之門”項目,評估美國數據中心選址
OpenAI“星際之門”首期工廠亮相
谷歌加速AI部門整合:AI Studio團隊并入DeepMind
SpaceX總部將遷往得州“星際基地市”
廣成科技USBCAN-II C+型CAN盒是什么
廣成科技USBCAN II C+可用的GCANtools功能
STM32F303 ucos ii任務調度都用什么?
谷歌DeepMind發布人工智能模型AlphaFold最新版本
谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3
MediaTek與望塵科技共同推動移動光追技術普及,為游戲玩家帶來沉浸式體驗
![MediaTek與望塵科技共同推動移動光追技術普及,為游戲<b class='flag-5'>玩家</b>帶來沉浸式體驗](https://file1.elecfans.com//web2/M00/CB/E4/wKgaomYfb-6AZYo2AAFqqSsI7cc17.jpeg)
評論