德撲被認為是難度遠超其他游戲的人工智能挑戰項目。然而CMU和Facebook聯合打造的AI賭神Pluribus,訓練成本150美元、8天訓練時間即吊打職業選手,每小時贏1000美元!如此強悍的AI是如何煉成的?要研究其算法該如何入手?
人們發現規則明確的游戲,即使像星際這樣戰局多變的即時戰略游戲,人類也無法戰勝擁有碾壓性算力優勢的計算機。于是有人寄希望于帶有運氣成分、需要大量心里戰的***。
*** (Texas hold'em,有時也簡稱為Hold'em或Holdem),簡稱德撲,是世界上最流行的公牌撲克衍生游戲,也是國際撲克比賽的正式競賽項目之一。***是位置順序影響最大的撲克衍生游戲之一,因為所有輪數的下注次序維持不變。它也是美國多數***內最受歡迎的撲克牌類游戲,在美國以外的地區也十分流行,理論上一桌同時最多可容納22位(若不銷牌則為23位)牌手,但一般是二至十人一桌。ht***.wikipedia.org/wiki/%E5%BE%B7%E5%B7%9E%E6%92%B2%E5%85%8B
賭神下凡:1小時贏7000塊,一周煉成百萬富翁
撲克是典型的不完美信息博弈游戲。***中,玩家無法獲知已發生事件的全部信息,一對一無限注中包含10^160個決策點(decision points)。
每個點需要根據出牌方的理解,產生不同的路徑。這種不完整信息的特質,使得***成為難度遠超其他游戲的人工智能挑戰項目。
然而,其實結局早就在暗中被注定了。40年來,科學家就一直沒有停止過對德州的研究。
10年前,計算機第一次在有限制的***游戲中,戰勝了人類頂級選手;4年前,來自加拿大阿爾伯塔大學的研究團隊開發出Cepheus(仙王座),一個號稱人類無法戰勝的撲克機器人;2年前,也就是2017年,加拿大和捷克的科學家在arXiv上發表論文,提出名為DeepStack的算法,稱可以讓人工智能在比賽中擁有“直覺”。
而前兩天,在CMU科學家的努力下,人工智能已經在六人無限注德撲比賽上擊敗所有人類頂尖玩家。只存在于電影電視劇中的賭神,現在真實的存在于現實世界了!
-
計算機
+關注
關注
19文章
7545瀏覽量
88672 -
人工智能
+關注
關注
1796文章
47725瀏覽量
240376
原文標題:1小時贏1000美元的AI賭神是怎樣煉成的?幕后團隊在線答疑
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論