在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么DeepMind的科學家們對星際爭霸如此癡迷

Tensorflowers ? 來源:cc ? 2019-01-29 10:43 ? 次閱讀

北京時間 1 月 25 日凌晨 2 點, DeepMind 直播了他們的 AI AlphaStar 和人類頂尖的職業電競選手對戰星際爭霸 2。根據 DeepMind 介紹,AlphaStar 在 2018 年 12 月 10 日和 19 日先后以 5:0 全勝的戰績擊敗了 2 位國際頂級的人類選手,此次直播的過程中也播放了之前比賽的重放。雖然 AlphaStar 在最后一場現場直播的比賽中惜敗,但是仍然保持對人類 10 勝 1 敗的戰績。

星際在全球玩家眾多,是最流行的一款實時策略游戲之一,而 DeepMind 匯聚了全球最頂尖的人工智能科學家,似乎兩者出現在同一個場景里有些違和。大眾刻板印象里面,科學家一般都與實驗科研為伍,怎么會對玩星際感興趣呢?

其實如果大家對于 DeepMind 這個公司有所了解的話,就會發現這個世界一流的人工智能團隊實際就是一路打游戲過來的。DeepMind 的創始人 Demis Hassabis 自小酷愛國際象棋,13 歲就成為了國際象棋大師。之后他于 2010 年成立 DeepMind,專門開發能夠玩游戲的人工智能。這個時候人工智能領域大火,DeepMind 順勢推出了自己的深度強化學習 (Deep Reinforcement Learning),并于 2014 年在 Atari 游戲里面超過了人類水平。2014 年之后 DeepMind 被 Google 收購,借助 Google 的資源優勢繼續研發,從此在游戲領域一騎絕塵。2016 年和 2017 年 DeepMind 的 AI 先后戰勝圍棋世界冠軍李世石和柯潔。接著 DeepMind 又推出了 AlphaZero,完全不借助人類棋譜,幾個小時之內就在圍棋,國際象棋和日本將棋上超過了人類水平。

DeepMind 之所以對于游戲如此熱衷,除了創始人的游戲情節以外,最關鍵的還是游戲本身就是絕佳的人工智能測試環境。游戲就是人為創造的,用以幫助人來習得某個技能或者測試技能水平的工具。游戲通過提供明確的反饋,使人可以在短期內不斷重復某些行為,從而習得技能。比如很多棋類游戲的設計初衷就是鍛煉分析決策能力。當然也有專門用來讓人獲得愉悅的游戲,比如說許多網絡游戲。這些游戲一般會有很強獎勵(比如獲得金幣之類),獲得獎勵的速度也很快,這就是這類游戲容易讓人沉迷的原因。

回過頭來說星際本身。為什么 DeepMind 的科學家們看中了這么一款游戲呢?原因主要是星際爭霸有這樣兩個特點:

第一星際爭霸的動作空間和策略非常復雜。圍棋雖然每次落子的變化也很多,但是每次畢竟只是需要根據盤面挑選落子地方,還算比較簡單。相對而言,星際爭霸里面的的動作空間就很復雜,玩家需要:

1)積累資源

2)建設工廠

3)組建軍隊

4)消滅對方的工事

每一個動作之間相互有影響,許多動作產生的后果是很長期的

第二玩家沒有全部的信息。基本上來說玩家只知道顯示在屏幕上面的一小部分區域的信息。而真正的地圖是很大。所以如果他們想要知道對手的信息,需要派出專門的偵查兵

為了這次的對戰,DeepMind 其實已經準備已久。去年 DeepMind 和暴雪聯合推出了基于星際爭霸 2 的強化學習測試平臺并且發布了論文《StarCraft II: A New Challenge for Reinforcement Learning》。這次參與對戰的 AI 也是從這個平臺上訓練得到的。這里主要解答一些大家可能關心的問題。AlphaStar 的視角能夠看到的是什么信息?它的操作和人是否一樣?有沒有作弊?

AlphaStar 到底是看到的什么呢?

我們都知道人類玩家在玩星際的時候看到的是計算機屏幕的信息(如果是團戰可能還會有場下交流)。計算機屏幕上面的信息是標準的視頻流。人類玩家首先做的實際上是識別哪個士兵,哪個是工廠。在計算機視覺里面,這些被稱為物體識別和場景識別任務。值得一提的是識別這些人物本身很困難,但和策略的部分關系不大。所以 Deepmind 對問題進行了一些簡化。 AlphaStar 以圖像的方式從游戲引擎里面讀取特征信息,這些圖像直接標記了哪里是兵或者工廠。你可以想象,AlphaStar 有很多只眼睛,有的看到兵,有的看到所有的工廠。除了計算機屏幕上面的信息,AlphaStar 還可以看到一個粗略的全景地圖,可以另外知道一些全局的信息,比如當前有多少資源,多少兵力等等。AlphaStar 看到的視角實際上長得像是下面這個樣子。

那么 AlphaStar 是怎么進行操作呢?

人類玩家都知道玩星際很多時候是拼手速。操作速度快的人基本可以碾壓操作速度慢的人。人類一般一分鐘進行 30 到 300 次操作。最厲害的人類選手大概是每分鐘 500 次操作。理論上計算機的操作速度遠遠超過人類,所以如果不限定操作速度的話,比較基本上沒有意義了。在 DeepMind 發布的工具包里面,操作速度被限制為每分鐘 180 次。除此以外,DeepMind 盡量讓 AlphaStar 的操作和人的操作是一樣的。人類玩家的正常操作一般來說是一個鼠標鍵盤序列。比如說要移動兵的話,人一般會先按 m 代表進入 move 操作,再按 shift 同時點擊要移動的兵。AlphaStar 的操作也會產生類似的序列。

根據上面的信息,我們知道 AlphaStar 的輸入和輸出其實和人類選手是差不多的,并沒有特殊作弊的行為。從這次的比賽視頻來看,AlphaStar 在選擇策略上如同職業選手般嫻熟,非常令人驚嘆。那么 Deepmind 大概是用了什么樣的方法來訓練 AlphaStar 的呢?Deepmind 在賽后發布了一篇博客進行了介紹。據說相應的論文正在同行評議中,相信不久就會將看到細節。這里我結合博客內容和我自己相關的經驗進行下簡單介紹。

Deepmind AI 的深度網絡由多個模塊構成,看起來主要的網絡是一個被稱為 Transformer 和 LSTM 的網絡結構構建。這類網絡最重要的特點就是有很長的記憶能力,可以在很長的序列里面自動找到數據中的關聯,早期這類網絡是在自然語言處理里面成熟的。之所以這次使用這樣的網絡結構,我猜測主要是星際里面的很多動作的影響時間很長,比如說開始建一個工廠到真正這個工廠開始能夠提供物資需要過很久。訓練的過程和初代版的 AlphaGo 類似,結合了有監督學習 (Supervised Learning) 和強化學習 (Reinforcement Learning)。這兩種學習方法其實我們人類也常用 — 有監督學習相當于從課本上面學習,而強化學習像是從實踐中摸索。有監督學習和強化學習并用,就相當一個人先從課本上學習大概知識然后學以致用,在實踐中不斷改進。

在 AlphaStar 中,第一步的訓練是在暴雪提供的數據集上進行的有監督學習。據 DeepMind 稱,經過有監督學習,AlphaStar 對暴雪的內置 AI 能保持 95% 上的勝率。接下來很多經過有監督學習的 AlphaStar 進行聯賽 (League),相互對打,在這個過程中使用強化學習不斷提升能力。下面這個圖展示了這兩個階段水平的提升。

可以看出,有監督學習使得 AlphaStar 達到人類中的金牌水平(Gold Level),在進行了 8 天強化學習之后,AlphaStar 最終超過人類選手 TLO。14 天之后超過了人類選手 MaNa。值得一提的是,在 14 天的強化學習訓練期間,每個 AlphaStar 相當于完成了 200 年的游戲試驗。尤其是多個 AlphaStar 相互對戰,需要的計算量極其巨大。為了加快計算速度 DeepMind 使用了 Google's v3 TPU (向量計算單元)開發了一個分布式訓練系統。TPU (Tensor processing unit) 是 Google 開發的專門用于人工智能處理器,從 2016 年推出,至今已經演進到第三代。每一個 AlphaStar 智能體使用了 16 塊 三代 TPU,這是相當驚人的計算能力 — 要知道幾個小時滅掉 AlphaGo 的 AlphaZero 在對弈的時候也不過只用了 4 塊一代 TPU。

AlphaStar 之所以能夠使用 TPU 的強大算力,得益于從 16 年起 Deepmind 將主要研究平臺轉移到了 TensorFlow 上面。TensorFlow 是 Google 開發的開源機器學習平臺,如今也是最受歡迎機器學習系統之一。TPU 就是專門為 TensorFlow 開發的硬件。除了 DeepMind 以外,Google 大部分的人工智能系統也都是基于 TensorFlow。

芯片領域有一個摩爾定律,就是計算力隨著時間是指數增長的。其實人工智能領域也有著類似的規律,比如說 AlphaGo 對陣李世石的時候人類尚可一戰,不久之后對戰柯潔人已經完全不在 一個量級。相信隨著時間的前進,AlphaStar 也會不斷的強大,同時在更多的問題上人工智能也會超過人類。許多人因此擔憂人會隨著人工智能的發展人變得多余。其實我們大可不必擔憂,雖然如今人工智能在許多地方取得了不俗的成就,但其本質仍然是人類的工具。人類歷史其實就是一個不斷的發明創造新的工具的歷史,從火的使用,到蒸汽機,再到如今的人工智能,無一不是如此。在新的時代,新的人類必然會懂得如何去使用全新的工具。AlphaStar 的星際爭霸首秀,可能是這個新的時代的又一個序章。回到文初的問題,為什么科學家們會對星際爭霸如此癡迷 — 因為這不僅是游戲里的星際,更是人類的星辰大海。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48518

    瀏覽量

    245420
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    11255

原文標題:AlphaStar 星際首秀,人工智能走向星辰大海

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    星際電涌:未來紀元(3)

    個嶄新的紀元。《星際電涌:未來紀元》以這場變革為背景。講述了年輕科學家塞拉斯·沃克的傳奇故事,從深海探險的意外發現,到與虛空能源集團的生死較量,再到星淵聯盟的壯麗
    的頭像 發表于 03-01 08:32 ?170次閱讀
    <b class='flag-5'>星際</b>電涌:未來紀元(3)

    我國科學家制備出可控手性石墨烯卷

    日前,我國科學家開發了一種名為“石蠟輔助浸入法”的新技術,成功讓二維材料“卷起來”,制備出具有可控手性的石墨烯卷,為未來量子計算和自旋電子器件的發展奠定了堅實基礎。 由天津大學教授胡文平、雷圣賓、李
    的頭像 發表于 02-26 11:17 ?383次閱讀

    星際電涌:未來紀元(2)

    故事梗概《星際電涌:未來紀元》以一場震撼宇宙的能源革命為背景,講述了年輕科學家塞拉斯·沃克的傳奇故事,從深海探險的意外發現,到與虛空能源集團的生死較量,再到星淵聯盟的壯麗誓言,這是一場關于勇氣、智慧與犧牲的旅程,更是對人類未來無限可能的深情憧憬。讓我們一同見證這場震撼人心
    的頭像 發表于 02-22 08:33 ?133次閱讀
    <b class='flag-5'>星際</b>電涌:未來紀元(2)

    星際電涌:未來紀元(1)

    故事梗概《星際電涌:未來紀元》以一場震撼宇宙的能源革命為背景,講述了年輕科學家塞拉斯·沃克的傳奇故事,從深海探險的意外發現,到與虛空能源集團的生死較量,再到星淵聯盟的壯麗誓言,這是一場關于勇氣、智慧與犧牲的旅程,更是對人類未來無限可能的深情憧憬。讓我們一同見證這場震撼人心
    的頭像 發表于 02-15 08:32 ?164次閱讀
    <b class='flag-5'>星際</b>電涌:未來紀元(1)

    NVIDIA RAPIDS cuDF如何賦能AI加速數據科學

    隨著 AI 正幫助各行各業推動創新和提高效率,基于海量的高質量數據來訓練各種模型是充分發揮 AI 應用潛力的必經之路,正因如此,數據科學家面臨著日益增長的工作負載需求,迫切需求尋找高效趁手的工具以應對挑戰。
    的頭像 發表于 01-24 09:26 ?462次閱讀

    深開鴻亮相“小小科學家”品牌發布暨科學探索研學營開營活動

    為在青少年中營造學科學、愛科學、用科學的濃厚氛圍,1月14日,由市委組織部、市委教育工委、團市委共同主辦的“小小科學家”品牌發布暨科學探索研
    的頭像 發表于 01-15 21:17 ?421次閱讀
    深開鴻亮相“小小<b class='flag-5'>科學家</b>”品牌發布暨<b class='flag-5'>科學</b>探索研學營開營活動

    西湖大學:科學家+AI,科研新范式的樣本

    研究,創新科研新范式。這一點在西湖大學的科研項目中已得到體現。 成立于2018年的西湖大學是由施一公院士領銜創辦的、聚焦前沿科學研究的研究型大學,該校鼓勵科學家探索AI與各學科交叉融合,為科研創新提速。為此,西湖大學在浪潮信息
    的頭像 發表于 12-12 15:59 ?423次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    了傳統學科界限,使得科學家能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了一種全新的科學研究范式,即數據驅動的研究范式,這種范式強調從大量數據中提取有價值的信息,從而推動
    發表于 10-14 09:21

    受人眼啟發!科學家開發出新型改良相機

    新型事件相機系統與標準事件相機系統對比圖。 馬里蘭大學計算機科學家領導的一個研究小組發明了一種照相機裝置,可以改善機器人觀察周圍世界并做出反應的方式。受人眼工作原理的啟發,他們的創新型照相機系統模仿
    的頭像 發表于 07-22 06:24 ?463次閱讀
    受人眼啟發!<b class='flag-5'>科學家</b>開發出新型改良相機

    中國科學家發現新型高溫超導體

    據新華社報道,我國科學家再立新功,又一新型高溫超導體被發現。 復旦大學物理學系趙俊團隊利用高壓光學浮區技術成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導的體超導電性,而且超導體積分數達到
    的頭像 發表于 07-19 15:14 ?1010次閱讀

    天津大學科學家突破人類大腦器官成功驅動機器人

    在科技探索的征途上,天津大學的科研團隊再次邁出了令人矚目的步伐。7月5日,該校宣布了一項革命性的成果——科學家利用前沿的干細胞技術,成功培育出了高度模擬人類大腦的類腦器官,并創新性地將其與機器人系統通過先進的片上腦機接口技術緊密相連,開啟了人腦與機器深度融合的新紀元。
    的頭像 發表于 07-08 16:00 ?834次閱讀

    新華社:突破性成果!祝賀我國科學家成功研發這一傳感器!

    6月25日,新華社以《突破性成果!祝賀我國科學家》為標題,報道了由我國科學家研發的傳感器成果。 我國科學家研發高通道神經探針實現獼猴全腦尺度神經活動監測 神經探針是一種用來記錄神經活動的針狀電傳
    的頭像 發表于 06-27 18:03 ?754次閱讀
    新華社:突破性成果!祝賀我國<b class='flag-5'>科學家</b>成功研發這一傳感器!

    前OpenAI首席科學家創辦新的AI公司

    消息在業界引起了廣泛關注,因為蘇茨克維曾是OpenAI的聯合創始人及首席科學家,并在去年在OpenAI董事會上扮演了重要角色。
    的頭像 發表于 06-21 10:42 ?696次閱讀

    科學家研制出一款新型柔性X射線探測器

    英國科學家開發出一種有機半導體材料,并利用其研制出一款新型柔性X射線探測器。這種探測器不僅“身段”更柔軟,可貼合需要掃描物體的形狀,從而提高患者篩查的準確性,降低腫瘤成像和放射性治療的風險,而且成本
    的頭像 發表于 06-13 06:29 ?545次閱讀

    科學家開發電驅動有機半導體激光器

    圣安德魯斯大學的科學家經過長達數十年的努力,在緊湊型激光器研究方面取得了重大突破。 激光在世界各地廣泛應用于通信、醫學、測量、制造和測量等領域。它們用于在互聯網上傳輸信息,用于醫療,甚至在
    的頭像 發表于 06-04 06:30 ?378次閱讀
    <b class='flag-5'>科學家</b>開發電驅動有機半導體激光器
    主站蜘蛛池模板: 人人人人凹人人爽人人澡 | 丁香婷婷久久大综合 | 亚洲男人的天堂成人 | 天堂8资源在线官网资源 | 天天躁夜夜躁狠狠躁躁 | 欧美mv日韩mv国产mv网站 | 色五月丁香五月综合五月 | 免费恐怖片 | 手机看片福利国产 | 看日本黄大片在线观看 | 新版bt天堂资源在线 | 二区视频在线 | 高清一区二区三区免费 | 成人五级毛片免费播放 | 国产稀缺精品盗摄盗拍 | 国产片一区二区三区 | 久久国产精品无码网站 | 日韩一级片在线播放 | 日韩免费三级 | 五月天精品 | 亚洲综合精品一区二区三区中文 | 小说老卫陈红张敏陈法蓉 | 国内精品久久影视免费 | 欧美成人免费草草影院 | 亚洲第一成网站 | 精品免费 | a一级日本特黄aaa大片 | 爱操视频在线观看 | 综合色爱 | 欧美色视频超清在线观看 | 亚洲伊人成综合成人网 | 天天插天天 | aaa在线观看高清免费 | 欧美深夜福利 | 五月婷婷丁香 | 中日韩一级片 | 国产一区二区三区美女图片 | 国产美女一区二区三区 | 欧美女同在线观看 | 色之综合天天综合色天天棕色 | 日本69sex护士xxx|