在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI能游戲里稱霸,但是如何解決現實問題還是個難題

mK5P_AItists ? 來源:未知 ? 作者:鄧佳佳 ? 2018-04-04 11:03 ? 次閱讀

據《大西洋月刊》報道,直到最近,那些能在各類游戲中擊敗人類冠軍的機器,解決現實問題太難了。

1997年,為了在國際象棋中擊敗象棋大師加里·卡斯帕羅夫(Garry Kasparov),IBM的工程師們在他們的“深藍”(Deep Blue)電腦中使用了幾個世紀的國際象棋智慧。2016年,通過研究成千上萬的人類對戰經驗,谷歌旗下人工智能AI)子公司DeepMind的AlphaGo擊敗了韓國圍棋冠軍李世石(Lee Sedol)。

圖:在波多黎各圣洛倫佐(San Lorenzo)的一家養老院走廊里,一名看護人員正用筆記本電腦來監控機器人護理人員,后者正為20位老年人提供服務

但是現在,AI研究人員正在重新思考機器人融合人類知識的方式。當前的趨勢是:不需要那么麻煩。

2017年10月份,DeepMind團隊公布了新的圍棋系統——AlphaGo Zero的細節,該系統根本沒有研究人類的下棋經驗。相反,它直接從研究游戲規則開始,并與自己對抗。它的第一個動作完全是隨機的,而在每場比賽之后,它都對幫助其取勝或導致其失敗的新知識進行了總結。

在這些混戰結束后,AlphaGo Zero與曾經擊敗李世石的AlphaGo超人版本進行了正面交鋒,并以100:0的戰績完敗對手。

這個團隊繼續開發了AlphaGo家族的另一個游戲大師,并為其取名AlphaZero。去年12月份,DeepMind的研究人員在科學網站ArXiv.org上發表論文指出,經過從頭開始的重新設計,AlphaZero的表現優于AlphaGo Zero。換句話說,它擊敗了曾擊敗過世界上最好圍棋棋手的機器人。

當它獲得國際象棋規則或日本將棋的規則時,AlphaZero也很快學會了擊敗這些游戲頂級算法的方式。專家們對該項目咄咄逼人、令人感到陌生的風格感到驚嘆。丹麥大師彼得·海恩·尼爾森(Peter Heine Nielsen)在接受BBC采訪時表示:“我一直在想,如果有更高級的物種降落在地球上,他們是如何下國際象棋的。現在我知道了。”

在過去的一年里,在各種各樣的場景中出現了超凡脫世的自學機器人,如無極限撲克和《Dota 2》。

當然,投資于這些和類似系統的公司比僅僅控制視頻游戲比賽更有野心。像DeepMind這樣的研究團隊希望將類似的方法應用到現實世界中幫助解決實際問題,比如建造室溫超導體,或者理解將蛋白質折疊成有效藥物分子的方式。

當然,許多實踐者希望最終建立起通用人工智能,這是個定義尚不清楚但卻令人著迷的目標:機器可以像人類那樣思考,并可以幫助解決許多不同類型的問題。

然而,盡管在這些系統中進行了大量投資,但目前的技術能走多遠還不清楚。華盛頓大學計算機科學家佩德羅·多明戈斯(Pedro Domingos)說:“我不確定AlphaZero的想法是否能輕易地推廣開來,畢竟游戲是極為特殊的東西。”

許多游戲、國際象棋和圍棋都有一個特點,就是玩家可以隨時看到兩邊的棋子。每個玩家都有關于游戲狀態的“完美信息”。無論游戲有多么復雜,你所需要做的就是從當前的情況出發去思考。然而,很多真實情況并非如此。

想象一下,讓電腦診斷疾病或進行商務談判。卡內基梅隆大學計算機科學專業博士生諾姆·布朗(Noam Brown)表示:“大多數現實世界的戰略互動都涉及隱性信息,我覺得這被大多數AI社區忽視了。”

布朗擅長的撲克為AI提供了不同的挑戰,因為你看不到對手的牌。但在這個領域,通過與自己競爭來學習的機器現在也達到了超人的水平。2017年1月份,布朗及其導師托馬斯·桑德霍爾姆(Tuomas Sandholm)創建了名為“Libratus”的項目,在20天的比賽結束后,他們在競爭對手的領先優勢下,以超過170萬美元的優勢擊敗了4名職業撲克選手。

另一款更讓人望而生畏的游戲是《星際爭霸2》(StarCraft II),這是一款擁有大量粉絲的多人在線視頻游戲。玩家選擇一個團隊組建軍隊,并在科幻場景中發動戰爭。但戰爭場景籠罩在迷霧中,只有玩家才能看到他們有士兵或建筑的地方。即使是對你的對手進行偵察,這個過程也充滿了不確定性。

這是一款AI仍然不能徹底掌控的游戲。影響其成功的障礙包括在一場游戲中動作的絕對數量,通常可能會達到成千上萬個。每個玩家(無論人類還是機器)都需要擔心每次點擊可能帶來的無數后果。就目前而言,AI還無法在這一領域與頂級人類玩家進行針鋒相對的抗衡,但這是一個目標。在2017年8月份,DeepMind與開發《星際爭霸2》的暴雪娛樂公司合作,發布了他們所謂幫助AI研究人員征服游戲的工具。

盡管面臨挑戰,《星際爭霸2》的目標仍然十分明確,那就是消滅敵人。這是它與國際象棋、圍棋、撲克、《dota 2》以及其他所有游戲的共同之處。在游戲中,你可以贏得勝利。從算法的角度來看,所有問題都需要有個“目標函數”,即需要尋找的目標。當AlphaZero下棋時,這并不太難。AlphaZero的目標函數是將分數最大化,而撲克機器人的目標函數也很簡單,就是贏更多錢。

然而現實生活中的情況并不那么簡單。舉例來說,無人駕駛汽車需要一個更微妙的目標函數,類似于你對精靈解釋自己愿望時的那種謹慎措辭。比如:及時將乘客送到正確的目的地,遵守一切法律,在危險和不確定的情況下適當地衡量人類的生命價值。多明戈斯說,研究人員如何制定目標函數,這是“將一個偉大的機器學習研究者與一般的機器學習研究者區分開來的東西之一。”

想想微軟在2016年3月23日發布的Twitter聊天機器人Tay,Tay的目標是讓人們參與進來,它做到了。多明戈斯稱:“不幸的是,Tay發現:吸引人們最大化參與的最好方法就是宣泄種族主義言論。”在上線不到一天的時間內,它就被緊急召回。

有些事情并沒有改變,今天主要的游戲機器人采用的方法依然采用了幾十年前設計的策略。多倫多大學計算機科學家戴維·杜文多(David Duvenaud)說:“這幾乎是過去技術的爆發,只是增加了更多的計算。”

這些策略通常依賴于強化學習,一種不干涉的AI技術。工程師讓機器探索一個環境,并通過不斷的嘗試和錯誤來學習如何實現目標,而不是用詳細的指令對算法進行微觀管理。在AlphaGo和它的子代發布之前,DeepMind團隊曾在2013年取得了第一個巨大的、引人注目的成就,當時他們使用強化學習技術讓一個機器人學會掌控7款Atari 2600游戲,其中3款達到專家級別。

這一進程仍在繼續。2月5日,DeepMind發布了Impala,可以學習57款Atari游戲的AI系統,另外還有30個由DeepMind在三維空間中構建的任務。在這些游戲中,玩家可以在不同的環境中漫游,執行像打開門或收獲蘑菇這樣的任務。Impala似乎可以在任務之間傳遞知識,這意味著花在玩一款游戲上的時間也能幫助它在其他方面有所提高。

但在更大范圍內的強化學習,棋盤游戲和多人游戲允許玩家采用更具體的方法。在這里,探索可以采取自我啟發的形式,在這種情況下,一種算法可以通過不斷地與自己的副本角力,從而獲得戰略優勢。

這個想法可以追溯到幾十年前。在20世紀50年代,一位名叫亞瑟·塞繆爾(Arthur Samuel)的IBM工程師創建了一個棋盤游戲程序,該程序是通過將字母與測試方相匹配來學習的。在20世紀90年代,來自IBM的杰拉爾德·特索羅(Gerald Tesauro)開發出西洋雙陸棋程序,使算法與自身對戰。這個程序最終達到了人類專家的水平,設計出了非正統但十分有效的策略。

在游戲迭代中,使用“自我啟發”系統的算法面對同樣相匹配的對手。這意味著策略的改變會導致不同的結果,從而使算法得到即時的反饋。OpenAI的研究主管伊爾亞·蘇茨克維爾(Ilya Sutskever)說:“任何時候你學到新東西,只要你發現了一件小事情,你的對手就會立即用它來對付你。”

蘇茨克維爾和美國連續創業家伊隆·馬斯克(Elon Musk)共同創立了非營利組織OpenAI,致力于開發和分享AI技術,并將其引導到安全的應用領域。2017年8月,該組織發布了《Dota 2》機器人,控制角色Shadow Fiend(惡魔巫師),并在一對一的戰斗中擊敗了世界上最好的玩家。另一個OpenAI項目是在相撲比賽中模擬人類互相攻擊,最后它們教自己如何格擋和發動佯攻。蘇茨克維爾稱,在“自我啟發”的過程中,你永遠不能休息,必須不斷進步。

但是,“自我啟發”的舊觀念只是當今主流機器人的一個組成部分,它還需要一種方式將他們的游戲體驗轉化為更深層次的理解。國際象棋、圍棋以及像《Dota 2》這樣的視頻游戲,可能性甚至比宇宙中的原子排列方式更多。即使是在整個生命過程中,機器與自己的影子進行無數場虛擬競技戰斗,它也不可能碰到每個場景,并把它記錄下來,以便當它再次看到同樣的情況時,有記錄可查。

加州大學伯克利分校計算機科學家皮特·阿貝爾(Pieter Abbeel)說,要想在這種擁有無數可能性的海洋中生存,你需要泛化,并捕捉本質。IBM的深藍電腦用其內置的國際象棋公式做到了這一點。在有能力評估以前從未見過的棋路后,它可以采取行動和策略來增加獲勝的機會。然而,近年來,一項新技術使我們可以完全跳過這個公式。阿貝爾稱:“現在,突然之間,‘深網’就抓住了這一切。”

在過去的幾年里,深度神經網絡的人氣飆升,它是由一層層的人造“神經元”構成的,就像煎餅一樣。當一層神經元放電時,它們會將信號發送到下一層,以此類推。通過調整層與層之間的連接方式,這些網絡在將輸入轉化為相關輸出時變得非常棒,即使連接看起來顯得十分抽象。

舉例來說,給它們一個英語短語,它們可以訓練自己把它翻譯成土耳其語。給它們一個動物收容所的照片,它們就能辨認出哪些是貓。或者向它們展示一個游戲板,它們可以知道自己獲勝的概率有多大。但是,通常情況下,你需要首先給這些網絡大量的標記示例來進行訓練和實踐。

這就是為什么“自我啟發”系統和深層神經網絡如此契合的原因。“自我啟發”能產生大量的游戲,使深層神經網絡在理論上可以無限地提供它們需要自學的數據。反過來,深層神經網絡提供了一種方法來內化“自我啟發”過程中遇到的經驗和模式。但是這其中有一個問題。對于“自我啟發”系統來說,要想產生有用的數據,它們需要一個更現實的地方來玩。

加州大學伯克利分校的博士生切爾西·芬恩(Chelsea Finn)說:“所有這些游戲,所有這些結果,都是在你可以完美模擬世界的環境中進行的。”芬恩曾使用AI控制機器人手臂,并從傳感器中解讀數據。其他領域并不那么容易被模仿。

例如,無人駕駛汽車在應對惡劣天氣或騎單車者時遇到了困難。或者,它們可能無法捕捉到真實數據中出現的奇異可能性,比如恰好有鳥飛過擋住了汽車攝像頭。芬恩說,對于機器人手臂來說,最初的模擬提供了基礎物理學,讓手臂至少學會了如何學習。但是,他們沒有捕捉到接觸表面的細節,這意味著像擰開瓶蓋或進行復雜外科手術的任務也需要現實世界的經驗。

對于那些難以模擬的問題,“自我啟發”系統并不是很有用。蒙特利爾大學深度學習先驅約書亞·本吉奧(Yoshua Bengio)在電子郵件中寫道:“在真正完美的環境模型和學習環境之間存在著巨大的差異,尤其是當這個現實足夠復雜的時候。”但這仍然讓AI研究人員有辦法繼續前進。

很難確定AI何時能取得游戲霸主地位。你可以選擇卡斯帕羅夫在國際象棋中的失利,或者李世石敗給虛擬對手AlphaGo。另一個流行的選擇是,2011年美國智力游戲《危險邊緣》(Jeopardy)冠軍肯·詹寧斯(Ken Jennings)輸給了IBM電腦沃森(Watson)。沃森可以解析游戲的線索,處理文字游戲。兩天的比賽還沒有結束,詹寧斯就寫道:“首先,我歡迎我們的新電腦霸主。”

沃森似乎被賦予了人類在許多現實問題上所使用的文書技能。它可以用英語提示,以閃電般的速度翻查相關文件,找到相關的信息片段,并找到一個最好的答案。但七年后,現實世界繼續對AI提出了嚴峻的挑戰。2017年9月份健康雜志《Stat》發布的報告顯示,作為沃森腫瘤研究計劃(Watson for Oncology)的目標,研究和設計個性化的癌癥治療方案非常困難。

當被要求從AI的角度來比較上述兩種情況時,本吉奧寫道:“《危險邊緣》中的問題更容易理解,因為它們不需要太多的常識。而理解一篇醫學文章要難得多。同樣,需要進行很多基礎研究。”

盡管游戲很特別,但仍然存在一些類似的現實問題。DeepMind的研究人員拒絕接受采訪,理由是他們的AlphaZero目前正在接受同行評審。但該研究團隊已經表示,它的技術可能很快就能幫助生物醫學研究者,后者想要更多了解蛋白質的折疊。

為了做到這一點,他們需要弄清楚組成蛋白質扭結的各種氨基酸是如何折疊成小三維機器的,其功能取決于它的形狀。這在國際象棋中同樣十分棘手,化學家們很清楚地知道規則,可以計算出特定的場景,但是仍然有很多可能的配置方案,想要了解所有可能性幾乎是不可能的。

但是如果蛋白質折疊可以被配置成游戲呢?事實上,它已經存在了。自2008年以來,成千上萬的人類玩家嘗試過在線游戲《Foldit》,用戶可以在其折疊的蛋白質結構的穩定性和可行性上得分。機器可以以類似的方式訓練自己,也許通過嘗試通用強化學習來擊敗它之前的最好成績。

蘇茨克維爾認為,強化學習和“自我啟發”也有助于訓練對話系統。這將使機器人能夠通過自言自語的方式進行訓練,并實現與人類對話。考慮到專業的AI硬件正變得越來越快、越來越普及,工程師們將會有動力以游戲的形式提出越來越多的問題。蘇茨克維爾說:“我認為,將來自我啟發和其他消耗大量計算能力的方式將變得越來越重要。”

但是,如果最終的目標是讓機器盡可能多地完成任務,即使是自學成才、通才的棋盤游戲冠軍,比如AlphaZero,也可能有辦法實現。麻省理工學院認知科學家喬希·特南鮑姆(Josh Tenenbaum)說:“至少在我看來,你必須看到,真正的思維活動、創造性的思想探索以及我們目前在AI領域所看到的東西之間存在著巨大的鴻溝。這種智能是存在的,但它主要發生在偉大的AI研究人員的頭腦中。”

谷歌深度學習研究員弗朗索瓦·喬萊(Francois Chollet)說:“我要保持小心,不要過高估計玩這些游戲的重要性,不管是AI還是普通工作。人類不是很擅長游戲,但要記住,非常簡單的專業工具實際上可以實現很多目標。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    33973

    瀏覽量

    274879
  • 人工智能
    +關注

    關注

    1804

    文章

    48589

    瀏覽量

    245885

原文標題:AI可以在游戲里稱霸,但是解決現實問題太難了

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI玩具,還是AI工具?

    、元寶等國產大模型AI平臺的智能產品,將AI玩具變成行業內最引人注目的產品賽道之一。無論是從能對話的智能玩偶到可編程的教育機器人,AI玩具的市場規模迅速擴大。然而,爭議也隨之而來:這些產品究竟是真正的“智能玩具”,
    的頭像 發表于 05-16 01:04 ?6263次閱讀
    <b class='flag-5'>AI</b>玩具,<b class='flag-5'>還是</b><b class='flag-5'>AI</b>工具?

    【「零基礎開發AI Agent」閱讀體驗】+讀《零基礎開發AI Agent》掌握扣子平臺開發智能體方法

    都比較復雜,涉及到的基礎素材很多,而閱讀書籍的人并沒有,所以最好像其他的編程書籍一樣也建立一素材庫,幫助讀者更好的理解知識并有實際項目的參照價值。 不過總體來說,我還是從這本書中收獲頗豐,對AI
    發表于 05-14 19:51

    【「零基礎開發AI Agent」閱讀體驗】+ 入門篇學習

    的是基礎篇,主要從為什么要學習AI Agent和開發AI Agent的知識儲備入手進行介紹。作為入門AI Agent的小白還是很有必要學習的。這里將一些重要觀點作
    發表于 05-02 09:26

    AI電力需求激增,儲何解決 “吃電” 問題?

    電子發燒友網報道(文 / 黃山明)隨著 AI 技術的持續發展,其在我們生活中的參與度越來越高。AI 雖帶來諸多便利,卻離不開強大算力與充足電力的支撐。因此,AI 的發展必然帶動電力需求的增長,而儲
    的頭像 發表于 04-14 01:09 ?1246次閱讀

    在樹莓派上玩PS3游戲現實還是幻想?

    盡管模擬器通常被視為游戲領域的一小眾子集,但它具有諸多優勢,包括平臺獨立性、游戲保存以及將QoL模組融入您最喜愛的獨占主機游戲的能力。盡管老式的超任(SNES)、GameBoy和雅達
    的頭像 發表于 03-25 09:31 ?169次閱讀
    在樹莓派上玩PS3<b class='flag-5'>游戲</b>:<b class='flag-5'>現實</b><b class='flag-5'>還是</b>幻想?

    stm32cubide搜索不到.h文件的文本如何解決?

    如圖所示,我打開的是個頭文件,搜索框也添加了頭文件的搜索區域,但是搜索的內容只顯示.c文件按的,請問如何解決,謝謝各位。
    發表于 03-12 07:17

    富士通如何解鎖生成式AI紅利 從人才進化到業務賦

    正面臨一道必答題:您準備好駕馭這場生產力革命了嗎? 生成式AI有望帶來巨大的經濟價值。然而現實當中,許多企業陷入“工具先行,人才掉隊”的困境,采購最貴的AI系統,卻因不會提問、不懂調參、不敢創新,讓技術投資淪為昂貴的擺設。 這
    的頭像 發表于 02-25 17:32 ?708次閱讀

    自動駕駛“電車難題”如何解

    近年來,自動駕駛技術正以前所未有的速度發展,并逐漸服務于大眾出行。自動駕駛在帶來便捷和安全的同時,也引發了一系列倫理、法律和社會問題的探討,其中一便是自動駕駛中“電車難題”的應對方案。傳統的電車
    的頭像 發表于 02-25 08:54 ?382次閱讀

    DeepSeek如何解AI與熱成像的深度融合

    AI大模型遇到紅外熱成像,是簡單的算法疊加,還是感知能力的質變?
    的頭像 發表于 02-24 15:55 ?570次閱讀

    中興通訊AiCube:破解AI模型部署難題

    AI領域,DeepSeek等國產模型憑借算法優化,成功將訓練與推理的綜合成本降低了40%以上,這一突破使得中小型企業也輕松參與AI創新。然而,隨著AI技術的廣泛應用,模型部署的復雜
    的頭像 發表于 02-13 09:11 ?459次閱讀

    遠心鏡頭憑什么稱霸高精度測量領域?揭秘微米級精度的秘密武器!

    遠心鏡頭憑什么稱霸高精度測量領域?答案就在它的獨特成像特性、卓越測量精度以及廣泛的應用前景中
    的頭像 發表于 02-06 14:54 ?529次閱讀
    遠心鏡頭憑什么<b class='flag-5'>能</b><b class='flag-5'>稱霸</b>高精度測量領域?揭秘微米級精度的秘密武器!

    NVIDIA RTX AI PC如何解AI智能體

    生成式 AI 改變了人們將創意變為現實的方式。代理式 AI 進一步推進了這一進程 — 利用復雜的自主因果推理和迭代式規劃來幫助解決復雜的多步驟問題。
    的頭像 發表于 01-18 10:10 ?466次閱讀
    NVIDIA RTX <b class='flag-5'>AI</b> PC如<b class='flag-5'>何解</b>鎖<b class='flag-5'>AI</b>智能體

    NTC溫度傳感器解決儲領域難題

    NTC溫度傳感器解決儲領域難題。隨著社會逐步發展,受雙碳戰略及區域能源結構影響,儲領域已經成為全球持續討論的話題。儲領域分別包括風力儲
    的頭像 發表于 12-02 10:09 ?473次閱讀
    NTC溫度傳感器解決儲<b class='flag-5'>能</b>領域<b class='flag-5'>難題</b>

    游戲部署換新季,華為云 618 營銷季助力游戲企業闖關升級

    流暢的開黑體驗?今天準備嘗試用下華為云的服務,沉浸式感受游戲云端部署解決方案的強大。 ? ? ? ? 1、游戲架構介紹 1.1 服務器架構 不同的公司有不同的游戲服務器架構,所以部署的具體細節大多不相同,
    的頭像 發表于 06-18 22:48 ?550次閱讀
    <b class='flag-5'>游戲</b>部署換新季,華為云 618 營銷季助力<b class='flag-5'>游戲</b>企業闖關升級

    華為懸紅200萬全球求解難題 存儲技術和AI新型數據底座

    華為懸紅200萬全球求解難題? ?存儲技術和AI新型數據底座 ? ? ? 早在2019年,為加速科研成果產業化,突破關鍵技術難題;華為就已經開始每年發布奧林帕斯難題百萬懸紅“奧林帕斯獎
    的頭像 發表于 05-27 18:10 ?1374次閱讀
    主站蜘蛛池模板: 天天躁夜夜躁狠狠躁2024 | 午夜影院免费体验 | 伊人91在线 | 黄蓉h肉辣文大全 | 欧美日韩乱国产 | 天天看视频| 成人影院久久久久久影院 | 欧美一级www片免费观看 | 色宅男看片午夜大片免费看 | 一级黄色大全 | 亚洲成人精品 | 噜噜噜天天躁狠狠躁夜夜精品 | 五月天婷婷在线视频国产在线 | 日韩精品在线第一页 | 国产一级又色又爽又黄大片 | 日色视频 | 男人天堂色男人 | 一本大道加勒比久久 | 成人亚洲欧美综合 | 国产精品天天爽夜夜欢张柏芝 | 亚洲va欧美va国产综合久久 | 日本一区高清视频 | 欧美日韩伦理 | 色香首页| 夜夜网站 | 免费看啪啪网站 | 久久精品免视看国产成人2021 | 人人干97 | 琪琪午夜免费影院在线观看 | 日本免费看黄 | 日本一本一道久久香蕉免费 | 痴女在线播放免费视频 | 国产在线视频资源 | 五月综合激情网 | 4tube高清性欧美| 日本一区视频在线播放 | 天堂网ww| a久久久久一级毛片护士免费 | 久久天天躁狠狠躁夜夜2020一 | 国产福利在线免费 | 黑色丝袜在丝袜福利国产 |