Alphabet 旗下的 Deepmind,一個(gè)在人工智能領(lǐng)域或許稱(chēng)得上是世界領(lǐng)先的公司,去年虧損 5.72 億美元;在過(guò)去的三年中持續(xù)虧損,金額超過(guò) 10 億美元。
這意味這什么?人工智能是否正在走向崩潰?
其實(shí)不然。眾所周知,搞研究是最為燒錢(qián)的;因此,Deepmind 每年都投入大量的資金,金額甚至比之前任何相關(guān)項(xiàng)目的金額都要大。 話雖如此,但 DeepMind 虧損的上升幅度仍值得考慮:2016 年為 1.54 億美元,2017 年為 3.41 億美元,2018 年為 5.72 億美元。
這涉及到三個(gè)核心問(wèn)題:DeepMind 是否在科學(xué)上走上正軌?從 Alphabet 的角度來(lái)看,這種規(guī)模的投資是否合理?這種損失將會(huì)從整體上影響人工智能嗎?
深度強(qiáng)化學(xué)習(xí)的局限性
雷鋒網(wǎng)注:上圖為 AlphaGo 與李世石對(duì)戰(zhàn)
關(guān)于第一個(gè)問(wèn)題,人們有理由持懷疑態(tài)度。DeepMind 一心撲在深度強(qiáng)化學(xué)習(xí)上,該技術(shù)將主要用于識(shí)別模式的深度學(xué)習(xí)與基于獎(jiǎng)勵(lì)信號(hào)的強(qiáng)化學(xué)習(xí)相結(jié)合。
2013 年,DeepMind 在一篇激動(dòng)人心的論文中將這項(xiàng)技術(shù)命名為“深度強(qiáng)化學(xué)習(xí)”,該論文展示了如何訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)來(lái)玩各種 Atari 游戲,比如 Breakout 和 Space Invaders;不得不承認(rèn),有時(shí)候它們比人類(lèi)玩得都要好。 這篇論文是一篇工程杰作,大概也是促使 Alphabet 在 2014 年 1 月收購(gòu) DeepMind 的主要原因之一。隨后,該技術(shù)進(jìn)一步發(fā)展,推動(dòng)了 DeepMind 在圍棋和游戲 StarCraft(星際爭(zhēng)霸)中取得勝利。
問(wèn)題就在于,該技術(shù)對(duì)環(huán)境的依賴(lài)非常大:在玩 Breakout 時(shí),就連將游戲中的球拍向上移動(dòng)幾個(gè)像素這樣微小的變化,都會(huì)導(dǎo)致游戲性能急劇下降。DeepMind 在星際爭(zhēng)霸游戲里的勝利也有著同樣的局限——使用特定地圖和特定“種族”角色時(shí),其結(jié)果優(yōu)于人類(lèi);使用不同地圖和不同角色結(jié)果較差。如果要更換角色,則要從頭開(kāi)始重新訓(xùn)練系統(tǒng)。
在某種程度上,深度強(qiáng)化學(xué)習(xí)是一種渦輪增壓式的記憶,使用它的系統(tǒng)能夠?qū)崿F(xiàn)一些人們覺(jué)得不可思議的目標(biāo),但它們本身對(duì)自己在做的事情只有膚淺的理解。因此,當(dāng)前的系統(tǒng)缺乏靈活性,也無(wú)法在環(huán)境發(fā)生變化時(shí)進(jìn)行調(diào)整。
深度強(qiáng)化學(xué)習(xí)還需要大量的數(shù)據(jù)。比如,AlphaGo 在訓(xùn)練過(guò)程中參加了數(shù)百萬(wàn)次圍棋游戲,這遠(yuǎn)遠(yuǎn)超過(guò)了一個(gè)人想要成為世界級(jí)棋手所需要的數(shù)量;而且實(shí)現(xiàn)這個(gè)目標(biāo)需要巨大規(guī)模的計(jì)算資源,價(jià)格也不菲——據(jù)估計(jì),訓(xùn)練 AlphaGo 的成本為 3500 萬(wàn)美元。
不過(guò),這些都是出于經(jīng)濟(jì)學(xué)的考慮。正如 Rebooting AI (重啟人工智能)這本書(shū)中所說(shuō),真正的問(wèn)題在于信任。目前,深度強(qiáng)化學(xué)習(xí)只能在受到嚴(yán)格控制、很少出現(xiàn)意外的環(huán)境中進(jìn)行;將其運(yùn)行在幾千年里都沒(méi)有出現(xiàn)變化的環(huán)境里或許可行,但在現(xiàn)實(shí)生活中,人們可能不會(huì)想依賴(lài)它。
商業(yè)方面收效甚微
雷鋒網(wǎng)注:上圖為 Deepmind 創(chuàng)始人兼 CEO Demis Hassabis
由于現(xiàn)實(shí)生活中像 Deepmind 這樣一心專(zhuān)注游戲上的 AI 項(xiàng)目不多,因此,Deepmind 也尚未開(kāi)展任何關(guān)于深度強(qiáng)化學(xué)習(xí)的大規(guī)模商業(yè)應(yīng)用。包括 2014 年收購(gòu)時(shí)支付的 6.5 億美元,目前 Alphabet 已對(duì) Deepmind 投資約 20 億美元;相比之下,Deepmind 去年的營(yíng)收約為 1.25 億美元。
另外,適用于圍棋的 AI 技術(shù),可能不適用于解決其他具有挑戰(zhàn)性的問(wèn)題,比如癌癥和清潔能源。當(dāng)然,這可能只是時(shí)間問(wèn)題——DeepMind 至少?gòu)?2013 年開(kāi)始就致力于深度強(qiáng)化學(xué)習(xí),而且科學(xué)進(jìn)步很少能在一夜之間就轉(zhuǎn)化為商業(yè)產(chǎn)品。DeepMind 可能最終會(huì)找到一種方法,通過(guò)深度強(qiáng)化學(xué)習(xí)來(lái)產(chǎn)生更深入、更穩(wěn)定的結(jié)果。
最終,深度強(qiáng)化學(xué)習(xí)可能被證明像晶體管一樣,成為一項(xiàng)徹底改變世界的發(fā)明。
雖然 Deepmind 目前的戰(zhàn)略不如人們所希望的那么豐富,但它仍是深度強(qiáng)化學(xué)習(xí)領(lǐng)域的佼佼者;而且,DeepMind 管理嚴(yán)密,資金充足,擁有數(shù)百名博士,在游戲和圍棋方面又大獲成功,正在吸引越來(lái)越多的人才。如果人工智能領(lǐng)域的風(fēng)向發(fā)生了變化,DeepMind 轉(zhuǎn)向另一個(gè)方向,它仍然能走在前列。
與此同時(shí),從 Alphabet 方面來(lái)說(shuō),對(duì) Deepmind 的投資并不是一個(gè)大賭注;它還在人工智能領(lǐng)域押下了目前正在快速增長(zhǎng)的 Google Brain。對(duì)于年收入 1000 億美元、從搜索到廣告推薦等核心業(yè)務(wù)都依賴(lài)人工智能的 Alphabet 來(lái)說(shuō),進(jìn)行幾筆重大投資并不瘋狂。
對(duì)過(guò)度承諾的擔(dān)憂
雷鋒網(wǎng)注:Facebook 通過(guò) AI 來(lái)打擊假新聞
最后,DeepMind 在經(jīng)濟(jì)方面的表現(xiàn)將如何從總體上影響人工智能,這個(gè)問(wèn)題很難回答。如果炒作超過(guò)了實(shí)際效果,它可能導(dǎo)致“AI 寒冬”的到來(lái),甚至連支持者都不愿意投資。如果虧損繼續(xù)以每年約兩倍的速度增長(zhǎng),連 Alphabet 也可能被迫放棄 Deepmind,投資者也會(huì)重新調(diào)整對(duì)人工智能的熱情。
不僅僅是 DeepMind,許多有望實(shí)現(xiàn)的進(jìn)步還沒(méi)有真正實(shí)現(xiàn)。雖然 Mark Zuckerberg 在 2018 年 4 月向國(guó)會(huì)做出的承諾,即人工智能將很快解決假新聞問(wèn)題已經(jīng)得到了緩和;但承諾的成本從來(lái)都不高,對(duì)人工智能的熱情程度是由最終效果決定的,而不是承諾。
就目前的形勢(shì)而言,對(duì)人工智能進(jìn)行炒作遠(yuǎn)比構(gòu)建人工智能要容易。雖然在廣告和語(yǔ)音識(shí)別等有限領(lǐng)域已經(jīng)取得了巨大的進(jìn)步,但它無(wú)疑還有很長(zhǎng)的路要走。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47798瀏覽量
240587
原文標(biāo)題:火遍全中國(guó)的何同學(xué)告訴你,5G有什么用?
文章出處:【微信號(hào):pcbworld,微信公眾號(hào):PCBworld】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論