人工智能正以前所未有的態(tài)勢洶涌而來,一方面是風(fēng)投和創(chuàng)業(yè)創(chuàng)新,都把人工智能當(dāng)做了下一個尚未被開墾的寶地;另一方面是應(yīng)用,比起概念盛行的階段,現(xiàn)在的無人車、AlphaGo等已經(jīng)把人工智能技術(shù)帶到了“看得到摸得著”的境地。
那人工智能到底是什么?這個領(lǐng)域包含哪些要素?它將如何改變當(dāng)今世界,又面臨哪些問題和瓶頸?對于人工智能的應(yīng)用和商業(yè)化,哪些領(lǐng)域會最快顯現(xiàn)效果出來?
在清華大學(xué)“清華學(xué)堂計(jì)算機(jī)科學(xué)實(shí)驗(yàn)班”題為《人工智能的黃金時代》的演講中,創(chuàng)新工場董事長兼CEO李開復(fù)對“人工智能”進(jìn)行了深入淺出的講解分析。
在講解中,這位機(jī)器學(xué)習(xí)領(lǐng)域的博士對人工智能追古溯源、引用知名商業(yè)案例,并結(jié)合Google等巨頭的布局和調(diào)整,為受眾勾勒了人工智能的框架、要素、商用領(lǐng)域和條件,并且強(qiáng)調(diào)了人工智能當(dāng)前的瓶頸和對當(dāng)前互聯(lián)網(wǎng)市場的影響。
值得一提的是,這位中國最知名的創(chuàng)業(yè)導(dǎo)師還給有志于在人工智能領(lǐng)域進(jìn)行創(chuàng)業(yè)的創(chuàng)業(yè)者們提供了建議。
在這篇長達(dá)萬字的演講實(shí)錄里,關(guān)于人工智能、深度學(xué)習(xí)、Google的野心等,首次“科普式”地得以展現(xiàn)。
以下是李開復(fù)演講實(shí)錄:
謝謝大家!非常高興有這個機(jī)會又一次來到清華,尤其是在我最尊敬的姚期智教授的邀請和介紹之下。姚教授的姚班在全球已經(jīng)享有盛名,我從Google到創(chuàng)新工場,看到有非常多成功的工程師,都是在姚老師的培養(yǎng)之下成為了計(jì)算機(jī)界的頂尖人才。
在講人工智能之前,我想向大家介紹一下我的一些可能不太為人熟知的背景:其實(shí)在進(jìn)入幾個國際大公司任職之前,也就是在30多年前,我就進(jìn)入了人工智能領(lǐng)域。我是在1980年首先做的自然語言處理,1982年做的計(jì)算機(jī)視覺,1983做的語音識別,1985年做的人機(jī)對弈,1996年做的VR/AR……但我們現(xiàn)在知道,那時候我的這些選擇基本上都是非常“糟糕錯誤”的職業(yè)選擇,因?yàn)槊恳患虑椋叶际窃谒狞S金時代之前、白銀時代之前,甚至破銅爛鐵都不是的時代就涉足了。從這個事情上,其實(shí)我也想說,做計(jì)算機(jī)研究這個領(lǐng)域,本身的素質(zhì)能力當(dāng)然都非常重要,但是還要在正確的時候選擇正確的事情。我在錯誤的時候太過狂熱的跳進(jìn)了人工智能領(lǐng)域,與此同時,過去的三四十年人工智能也是起起伏伏,一下很火,一下又跌入谷底。
但現(xiàn)在是人工智能的黃金時代。可能各位也會問,憑什么這次說是人工智能的黃金時代?為了說明這個問題,這次我肯定不只用一些理論來說服大家,畢竟我過去也做了這么多“錯誤的選擇”——我今天還帶一些實(shí)際的數(shù)據(jù)來跟大家分享為什么我對今天的人工智能充滿信心。人工智能有很多分支,其中之一是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)里面還有一個分支是深度學(xué)習(xí),今天我更多的會用深度學(xué)習(xí)作為案例。
人工智能是一種工具
最近人工智能成為全球熱門新聞話題,很多是因?yàn)榇蠹铱吹紸lphaGo在幾個月前擊敗了李世石,最近在網(wǎng)上還傳出年底之前它要挑戰(zhàn)柯杰的消息。但在這個新聞的熱度之下,有一點(diǎn)讓我覺得很可惜:大家對這個話題討論的重心都放在了人工智能是不是在模仿人腦,“奇點(diǎn)”是否即將來臨這樣的問題上,卻沒有真正關(guān)注人工智能對我們的現(xiàn)實(shí)影響。
“奇點(diǎn)”認(rèn)為未來機(jī)器將有各種的智能、人類必須做一些事情來保護(hù)自己。我們在座的沒有任何一個人能夠證明或否定“奇點(diǎn)”,但就我個人而言,我認(rèn)為人工智能要取代人還是一個非常遙遠(yuǎn)的事情。我覺得我們需要更關(guān)注的事情是人工智能是今天能夠拿來用的工具,它能幫助人類解決問題,能取代重復(fù)性的工作,能創(chuàng)造商業(yè)價值。正因?yàn)檫@個理由,我認(rèn)為我們今天進(jìn)入了人工智能的黃金時代。
隨便舉幾個例子:今天很多的工作以后大部分都會消失,比如說翻譯,雖然現(xiàn)在還不是做的那么完美,但是每年進(jìn)步的都很快,再過幾年人工的翻譯可能就會非常難找到工作了。記者也同樣如此,如今90%美聯(lián)社的文章都是用機(jī)器來寫的。幾乎所有思考模式可以被理性推算的工作崗位,在有足夠數(shù)據(jù)支撐的時候,都會被取代。有人說十年之內(nèi)一半的工作會消失,有人說十五年之內(nèi)一半的工作會消失,我覺得這些都是合理的揣測。
我想在座大部分都會相信這個理論,而如果你對此還有懷疑,你可以想想,為什么AlphaGo這么厲害?就是因?yàn)樗梢詣佑玫綆浊_機(jī)器每天和自己對弈上萬盤的圍棋,而這人是做不到的;以后為什么自動駕駛會這么厲害呢?因?yàn)樗梢杂盟母鞣N的sensor在路上搜集數(shù)據(jù),這不是任何一個司機(jī)可以匹敵的。所以這些都是一些必然的過程。
何為人工智能
到底什么是人工智能呢?我覺得大概來說可能是有幾個部分。
首先是感知,感知就是包括視覺、語音、語言;然后是決策,剛剛講的做一些預(yù)測,做一些判斷,這些是決策層面的;那當(dāng)然如果你要做一套完整的系統(tǒng),就像機(jī)器人或是自動駕駛,它會需要一個反饋。
什么是人工智能?
在這些例子上可以看到,感知可能更多的是幫助識別圖里面一個嬰兒在沙發(fā)上抱著泰迪熊這種。在推薦上面,我舉的例子是一個用Google now通過你過去做的一些事情推測你下面要做什么,在最下面的例子你會看到有一個無人駕駛的汽車,它有各種的sensor,它捕捉的信息可以用來做最后的決策,比如怎么去操作方向盤、油門、剎車等等的。其實(shí)這三件事情的總和就是今天所被歸納為的人工智能。
再從博弈、感知決策以及反饋四個方面回顧一下人工智能的發(fā)展歷程。博弈今天就不講太多了,但是基本上我可以看到從我在大學(xué)做的Othello到Checkers再到DeepBlue chess,經(jīng)過很長的一段時間,終于有了今天AlphaGo打敗了圍棋世界冠軍。我們從中可以看到,這是一條長達(dá)三十多年的路程。
人工智能的各階段發(fā)展里程碑事件
在感知方面,從我的博士論文發(fā)表到Nuance成為一個頂尖的公司,從中國誕生了科大訊飛到美國的Deep Face、中國的Face++等等做得越來越好的企業(yè),這些年也有很多的進(jìn)步。還有一些很特殊的例子,比如最近看到一些搞笑的比較Microsoft Tay在Twitter上開始跟人家交流一下子就講了一堆不堪的話,就被Microsoft撤回了,所以這里有很多的成功例子,也有很多有趣的事件。
決策方面,從早期Microsoft Office里的工具到Google廣告的推薦,然后到金融行業(yè)的很多智能決策公司的出現(xiàn),進(jìn)步迅速。Google auto mail可能大家還沒有看過,但是如果你現(xiàn)在還在用gamil的話,會發(fā)現(xiàn)你有時候收到email,Google會跳出來問要不要發(fā)回復(fù),有時候它連回復(fù)都幫你寫好了,而且寫的很精確。這也是人工智能的體現(xiàn)。可能以后我們講話都不用,助理能幫我們搞定,人工智能的助理肯定也是一個方向。
最后是反饋,從CMU Boss早期的無人駕駛到Amazon用Kiva推動物流,再到最近的Pepper、Google car,我們可以看到這個領(lǐng)域過去三四年特別的熱,有很多看起來商業(yè)化已經(jīng)做的非常好。
科普深度學(xué)習(xí)
在這里,我要稍微深度講一下深度學(xué)習(xí)。
深度學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò),與但與之前的相比,它的特點(diǎn)是使用了多層網(wǎng)絡(luò),能夠?qū)W習(xí)抽象概念,同時融入自我學(xué)習(xí),而且收斂相對快速。收斂快速可能是一種技巧,不見得是一個理論,但是有一批人通過它解決了很多重要的問題。
簡單的來說,如果我們有很多笑臉,然后我們把笑臉的像素輸入到一個神經(jīng)網(wǎng)絡(luò)里面去,最后你那兒希望讓機(jī)器能識別這是姚明,那是馬云,但是因?yàn)槟氵@個深度學(xué)習(xí)的網(wǎng)絡(luò)很深,要一次性學(xué)會這么多也會比較困難,所以就需要用到一個比較快速收斂的技巧——自我學(xué)習(xí)。通過自我學(xué)習(xí),機(jī)器會逐步從大量的樣本中逐層抽象出相關(guān)的概念,然后做出理解,最終做出判斷和決策。
比如它可以有好幾層的nodes和connection,經(jīng)過這些nodes和connection,它在每一個層次會感知到不同的抽象特征,且一層比一層更為高級。這些都是通過自我學(xué)習(xí)實(shí)現(xiàn)的,而不是人教的。經(jīng)過自我學(xué)習(xí),從一個臉輸進(jìn)去再從同樣的一個臉輸出來,它就從里面抽象的學(xué)習(xí)到了一個人的臉重要特征。
深度學(xué)習(xí)的分層無監(jiān)督訓(xùn)練
經(jīng)過這個學(xué)習(xí)之后,我再去做監(jiān)督訓(xùn)練,看機(jī)器是否能夠識別他們,如果不能,就在訓(xùn)練之后做微調(diào)。例如,如果我輸入了馬云的臉,出來的卻是王寶強(qiáng),那訓(xùn)練系統(tǒng)就會告訴你的網(wǎng)絡(luò)說這個是錯誤的:這不是王寶強(qiáng),這是馬云。那接下來就是要進(jìn)行微調(diào),以便于下一次機(jī)器看到這個臉時,能識別出是馬云的概率高一些,出來王寶強(qiáng)的概率低一些。
分層無監(jiān)督訓(xùn)練
但是這么一調(diào)也不能調(diào)的太過火了,要不然就會有overtraining的問題,我們就對整個數(shù)學(xué)公式做一點(diǎn)微調(diào),用大量的數(shù)據(jù),不斷重復(fù)的去教它,經(jīng)過不斷微調(diào),那么它就很可能在多次之后降低識別錯誤。
其實(shí)這一整套理論在二三十年前就已經(jīng)有了,我在做我博士論文的時候,很多我的同事就在做訓(xùn)練神經(jīng)網(wǎng)絡(luò)的工作。
深度學(xué)習(xí)在最初的時候訓(xùn)練速度特別特別慢,所以比較難進(jìn)入工業(yè)級別或者是應(yīng)用級別,比如,你的手機(jī)是做不來這個的,因?yàn)樗乃俣葘?shí)在太慢了。但經(jīng)過這么多年,我們的計(jì)算機(jī)變的越來越快,另外也有了更多取巧的訓(xùn)練和識別做法,深度學(xué)習(xí)的應(yīng)用可能性也發(fā)生了變化,它能被應(yīng)用的領(lǐng)域越來越寬。多年前,我過早的進(jìn)入了這一領(lǐng)域,但是現(xiàn)在,人工智能大規(guī)模應(yīng)用的時機(jī)已經(jīng)到了。
憑什么這么說?一個很簡單的評估標(biāo)準(zhǔn)就是,我們的深度學(xué)習(xí)或者是任何的機(jī)器學(xué)習(xí),它是不是超越人類的能力表現(xiàn),如果超越的話,可能很多應(yīng)用就會產(chǎn)生。比如在機(jī)場,如果機(jī)器識別人臉的準(zhǔn)確度超過人,那么我們那些邊防的人就可能不需要那么多。這并不是說機(jī)器不會犯錯,而是說既然人不能比機(jī)器做的更好,那我不妨就用機(jī)器取代。
深度學(xué)習(xí)的應(yīng)用領(lǐng)域
在過去的五年,深度學(xué)習(xí)的準(zhǔn)確度從75%多提升到了97%左右,而人的表現(xiàn)準(zhǔn)確率大概是95%。從95%到97%聽起來只進(jìn)步了2%,但實(shí)際上是把錯誤率降低了40%,這是很大的進(jìn)步。如果這種進(jìn)步持續(xù),未來人工智能必然會超過人類的表現(xiàn),同時也將可以進(jìn)入一些可應(yīng)用的領(lǐng)域。這就是今天我講人工智能進(jìn)入黃金時代的證據(jù):在很多領(lǐng)域,也包括我們在face++做的人臉識別,包括了Apple、Google,科大訊飛的語音識別,它們的認(rèn)知水平將在未來幾年的時間內(nèi)超過人類,而一旦超過人類,應(yīng)用就會快速的增加。
深度學(xué)習(xí)的應(yīng)用領(lǐng)域舉例
深度學(xué)習(xí)首先可以應(yīng)用于識別,包括人臉識別和語音識別等,這些可以用于安防,安檢等。
人臉語音的數(shù)據(jù)來之不易,但是BI,商業(yè)的流程、互聯(lián)網(wǎng)的數(shù)據(jù)卻非常豐富。Google、百度很早就已經(jīng)在搜索,在廣告以及推薦系統(tǒng)里面充分使用了類機(jī)器學(xué)習(xí)技術(shù),解決該推薦什么商品,一個商品怎么定價,在什么位置會賣的最多,應(yīng)該把這樣的產(chǎn)品賣給誰等問題。這一類的推銷可以直接產(chǎn)生經(jīng)濟(jì)價值,而社交媒體營銷,整個互聯(lián)網(wǎng)廣告,這每一個領(lǐng)域都是幾十億,幾百億甚至更大的市場。
將智能用于炒股其實(shí)也是一個不錯的選擇。在國內(nèi)在國外,很多人都在做這方面創(chuàng)業(yè)的工作。利用智能,我可以隨時來算一籃子股票和期貨應(yīng)該如何對沖,以尋求最大的利潤。頂尖金融分析師也會做這個,但是他不可能把所有的股票的排列組合都考慮一遍,但是機(jī)器可以二十四小時不睡覺,每天都在算怎么能賺最多的錢。除此之外,deep learning深度學(xué)習(xí)的技術(shù)可以把各種的因素都融合進(jìn)來,比如這個公司的高管有沒有變動,今天出了什么新聞,行業(yè)里還有沒有什么變動……甚至你可以對一個智能系統(tǒng)說如果明天巴西發(fā)生了地震,什么股票該被購買,甚至你可以說發(fā)生了地震不要問我,你直接去買它就可以了。
銀行保險方面,比如說貸款該不該審批,則無論是銀行的貸款,還是P2P的貸款,都可以通過機(jī)器來判斷,而且數(shù)據(jù)未必要來自銀行內(nèi)部。
醫(yī)學(xué)方面,因?yàn)槲易约荷^病,也深深的受過這方面的痛苦,我也感覺到在今天的醫(yī)生的判斷真的不是最完善的。一方面醫(yī)生有好有壞,頂尖的醫(yī)生是非常少的;第二方面比如在癌癥方面,它每一年都有新的藥出來,那每個醫(yī)生每天忙著看病人,就不見得有時間去研究這些藥物,那些藥物也不是每個國家都可以使用的。還有就是每一個人,他的各種特質(zhì),不見得就適合用這個藥。這些其實(shí)都是可以用機(jī)器學(xué)習(xí)來做出來的。
前一陣我在美國碰到了一些科學(xué)家,他們正在用機(jī)器學(xué)習(xí)的方法來發(fā)明新藥。我們的科學(xué)研究方面當(dāng)然要有聰明的頭腦和很好的實(shí)驗(yàn),但是其中有一個很關(guān)鍵的部分,就要是一定的程度去排列組合:試很多東西,對小白鼠先試試這個有沒有用,再試試看那個有沒有用,然后再在猿猴身上實(shí)驗(yàn),再進(jìn)行人體實(shí)驗(yàn)。在以前,這整個過程都是由人腦完成,但是這個交給機(jī)器來做也許會更精準(zhǔn)。甚至有一家公司它養(yǎng)了非常多的白老鼠,他里面所有的實(shí)驗(yàn)都是通過機(jī)器學(xué)習(xí)精準(zhǔn)進(jìn)行:每天白老鼠活了幾只,死了幾只,什么藥可以進(jìn)到下一步……這些都是靠機(jī)器學(xué)習(xí)加上非常精密的系統(tǒng)來做。
我們發(fā)明的很多新的材料,都不是靠純粹的科學(xué)方法推出來的,也是去試一試,把這個碰到那個,就產(chǎn)生了有很特殊效應(yīng)的材料。這些知識都可以輸入我們的信息學(xué)習(xí)系統(tǒng),通過它我們可以幫助發(fā)明新的事物。
在教育方面也有應(yīng)用。在學(xué)習(xí)的過程中,如果基礎(chǔ)沒有打好,下一個層次根本學(xué)不下去。智能化的教育系統(tǒng)會識別你的學(xué)習(xí)水平,然后根據(jù)你的水平確定學(xué)習(xí)內(nèi)容。比如,你的乘法沒有學(xué)好,機(jī)器就不可能讓你去學(xué)除法。
當(dāng)然學(xué)習(xí)外語也是很好的例子,我們今天的語音識別做的這么好,為什么我們學(xué)外語還是一定要找外教,為什么語音識別不能再上一層樓呢?所以,當(dāng)你的技術(shù)一提高了,語音識別應(yīng)用就不會只是我的講話進(jìn)去然后文字出來,它還有可能用在教育領(lǐng)域。
在這么多機(jī)會之下,這個人工智能會重塑億萬級別的領(lǐng)域。當(dāng)然這個不是明天就會發(fā)生,因?yàn)槲矣X得人工智能在很多方面還是相當(dāng)大的欠缺……
人工智能將重塑億萬級別的領(lǐng)域
人工智能會重塑很多億萬級別的領(lǐng)域。當(dāng)然這個不是明天就會發(fā)生,因?yàn)榻裉煳覀冊诤芏嘞嚓P(guān)方面仍存在相當(dāng)大的欠缺。
比如,在我們的計(jì)算架構(gòu)上面,現(xiàn)在還是需要時間去做算法的改進(jìn)提升,需要去研究如何部署云端架構(gòu),另外深度學(xué)習(xí)用時仍太長,這些還都是需要探索的內(nèi)容,而且并沒有一個標(biāo)準(zhǔn)化的答案。
另外,算法框架也非常重要。我們可以看到有一些重要技術(shù)的推進(jìn),實(shí)際上是因?yàn)橛辛碎_源或者API或者標(biāo)準(zhǔn)的出現(xiàn),但現(xiàn)在仍有很多方面還沒有出現(xiàn)相關(guān)標(biāo)準(zhǔn)。當(dāng)然我們知道Google的TensorFlow等提供了一些開源的方法,但是其實(shí)他們還沒有真正的平臺化,比如你把TensorFlow丟給一個沒學(xué)過機(jī)器學(xué)習(xí)的人,哪怕是清華大學(xué)頂尖的計(jì)算機(jī)系學(xué)生,他也很難用其創(chuàng)造價值。如果清華的學(xué)生都不能,那它的普及性就有問題了。
為什么iOS、安卓能夠做的很好,就是因?yàn)樗a(chǎn)生了平臺化效應(yīng),使得很多人能夠比較容易的介入。然后我們可以看到像Hadoop這樣七八年前很多人覺得很高深的東西現(xiàn)在也慢慢變得平臺化了。今天,如何使得整個機(jī)器學(xué)習(xí)的體系平臺化,以便于讓更多的非專業(yè)人士能夠使用,這個是目前面臨的一個很大的瓶頸,需要一定的發(fā)展時間才能得以突破。
在一些領(lǐng)域中,很多技術(shù)性問題可以在兩三年內(nèi)得到解決,但是還有很多問題并非如此簡單,比如說語義。我們說語音識別是相對簡單的:音進(jìn)來,字出去,這個非常明確,一個API就可以調(diào)動。但是音進(jìn)來,確定是何種情境的語義出去就很難。這些我覺得兩三年遠(yuǎn)遠(yuǎn)還不夠,還需要更多的時間去理解。
傳感器一定程度來說是價格的問題、如何普及的問題。現(xiàn)在我們看到Google Car雖然做的很牛,但是正如馭勢科技的吳甘沙說的,Google Car實(shí)際商業(yè)化的一個巨大瓶頸就是價位的問題:傳感器實(shí)在太貴了。因此要把這件事做下來就是一個雞和蛋的問題——降低價格就需要量,但量怎么起來?價格不下去量也起不來。要解決這個問題也需要一定的時間。
最后還有很多機(jī)械方面的問題。控制機(jī)械運(yùn)動的算法,硬件運(yùn)動后給出的回饋等等在機(jī)械部門也還需要一些開發(fā)。
整體來說,雖然我認(rèn)為機(jī)器學(xué)習(xí)、深度學(xué)習(xí)在突破人類的精確度方面已經(jīng)做的非常好,但是以上幾個領(lǐng)域還是需要一些時間才能取得突破。但是這一天肯定是會來臨的,我們怎么知道會來臨呢?
Google的野心
我們知道,不久前Google重新組織了公司架構(gòu),將搜索業(yè)務(wù)和其他前沿項(xiàng)目子公司都放進(jìn)了控股公司Alphabet公司。很多分析師說,Google把搜索和其他的業(yè)務(wù)分開來做Alphabet,是為了優(yōu)化它的股價,其實(shí)這種說法太表面了,他們沒有了解一個真正有野心的公司在做什么。
一定程度上,Google之所以成立了Alphabet,是因?yàn)镚oogle經(jīng)過搜索和廣告業(yè)務(wù)的積累,逐步發(fā)展了一套我們可以簡稱為GoogleBrain的模式。Google Brain其實(shí)就是機(jī)器學(xué)習(xí)的大腦,這個機(jī)器包括了平臺也包括了專家,如果它用在搜索領(lǐng)域就是一個搜索引擎,如果它能夠用在醫(yī)學(xué)領(lǐng)域,那它可能就是一個癌癥診斷系統(tǒng),它也可以用于人類壽命的延續(xù)以及智能家電等各種不同領(lǐng)域。所以Google的野心就是把機(jī)器學(xué)習(xí)作為一個核心,然后用它去解決非計(jì)算機(jī)非互聯(lián)網(wǎng)領(lǐng)域的各種問題。
當(dāng)然它現(xiàn)在還不是一個整體平臺,但Google 就會找一些極聰明的人來進(jìn)軍這些領(lǐng)域,有平臺的用平臺,平臺未成形的就用聰明才智來想辦法。現(xiàn)在看來,Google這種模式也做成了很多有意義的事情。所以,對于Google,我們千萬不要低估了它的能力,因?yàn)檫@家公司可能是未來推動人工智能平臺化的最大力量。
怎么證明這是真的呢?從最近Jeff Dean演講的一張圖我們就可以看到Google內(nèi)部有多少項(xiàng)目在用深度學(xué)習(xí)。
Google內(nèi)部對深度學(xué)習(xí)的大量應(yīng)用
我們可以看到,從2012年到今天,Google對深度學(xué)習(xí)的利用在快速增長,應(yīng)用領(lǐng)域也極為廣泛。從這張圖我們就可以看到Google,也就是現(xiàn)在的 Alphabet在人工智能方面是多么的有野心。
再回到我原來的問題,我們現(xiàn)在是不是生逢其時,可以在正確的時候選擇進(jìn)入人工智能這個領(lǐng)域呢?如果我們相信Google這幫人很聰明,如果我們相信Google對深度學(xué)習(xí)的使用邏輯,我們也要相信人工智能的應(yīng)用期即將來臨。
深度學(xué)習(xí)的挑戰(zhàn)
深度學(xué)習(xí)也面臨挑戰(zhàn)
但是深度學(xué)習(xí)以及機(jī)器學(xué)習(xí)還面臨很多挑戰(zhàn)。這里有幾個問題。
第一個問題,就是我剛剛提到的:目前仍然沒有一個統(tǒng)一的平臺。在深度學(xué)習(xí)方面,現(xiàn)在的人懂就是懂,不懂就是不懂。這就是為什么Google最近花了重金不斷在挖業(yè)界頂尖的人才,給年輕人開出的年薪甚至超過200萬美元。這些人也就是二十來歲,博士剛畢業(yè)不久,怎么會這么值錢呢?
其實(shí)就是因?yàn)閮蓚€理由,第一,這些人進(jìn)入了公司之后,會被投入到健康、醫(yī)療、預(yù)防等等各個領(lǐng)域的研究。他們雖然每年拿走公司的兩百萬美金年薪,但是也許兩年后他們就能在相關(guān)領(lǐng)域創(chuàng)造出兩億美金的價值,所以對Google公司而言,這些人才實(shí)際上不貴,是非常劃算的。
第二個理由就是Google多雇一個,F(xiàn)acebook就得少雇一個。這不是開玩笑。因?yàn)樵诿绹腥齻€大公司在瘋狂挖人工智能的人才——Google、Facebook和Microsoft,他們之間競爭激烈,對人才的吸引力也不相上下。
第二就是深度學(xué)習(xí)的網(wǎng)絡(luò)太大,需要海量的數(shù)據(jù)。
第三,因?yàn)閿?shù)據(jù)太多,所以計(jì)算特別的慢,所以需要非常大的計(jì)算量。
第四點(diǎn)有點(diǎn)奇怪但也合理:機(jī)器無法用人的語言告知做事的動機(jī)和理由。即便機(jī)器訓(xùn)練做了很棒的深度學(xué)習(xí),人臉識別、語音識別做的非常棒,但它不能和人一樣,它講不出來這是怎么做到的。雖然有人也在做這方面的研究,但是在今天,如果一個領(lǐng)域是不斷需要告訴別人該怎么做,需要向別人去解釋為什么的,那這個領(lǐng)域?qū)τ谏疃葘W(xué)習(xí)來講還是比較困難的。比如Alpha Go打敗李世石,你要問Alpha Go是為什么走這步棋,它是答不上來的。
即便有如此多的局限,我們還是認(rèn)為人工智能在很多領(lǐng)域可以迅速應(yīng)用,并且可以幫助企業(yè)打造競爭壁壘。
人工智能如何幫企業(yè)打造競爭壁壘?可以從如下四個方面思考:
第一,如果你有壟斷性的大數(shù)據(jù),你就會有很大的優(yōu)勢。關(guān)于數(shù)據(jù)需要注意的幾點(diǎn)是,首先壟斷性大數(shù)據(jù)不是公開的數(shù)據(jù),不是剽來的數(shù)據(jù),也不是買來的數(shù)據(jù),因?yàn)檫@樣的事情你能做競爭對手也能做。其次,無標(biāo)簽的數(shù)據(jù)也不會給你帶來優(yōu)勢。再次,如果是人工標(biāo)簽的數(shù)據(jù)也不行,因?yàn)槿斯?biāo)簽太慢了。最好的數(shù)據(jù)是閉環(huán)的數(shù)據(jù),所謂閉環(huán)的數(shù)據(jù)就是在你應(yīng)用的時候可以捕捉到數(shù)據(jù)并且知道最終你根據(jù)數(shù)據(jù)做出的抉擇對或不對。我們投資的face++,它有和美圖、阿里的合作,就一定程度形成了特別大的數(shù)據(jù)的優(yōu)勢。
第二,擁有龐大的機(jī)群。機(jī)群是很重要的,包括需要什么處理系統(tǒng)的支持,怎么去部署,用什么樣的計(jì)算架構(gòu)等等。
第三,你要有一批特別懂的人。沒有平臺的時候,你就只能把一批人丟進(jìn)去,讓他們?nèi)ソ鉀Q特別大的問題。
第四,當(dāng)你沒有平臺的時候怎么辦?我們就可以找一批特別聰明的人,讓他們不斷的調(diào)節(jié)算法——當(dāng)然這構(gòu)成一個短期的競爭優(yōu)勢,從長期看,一旦大的人工智能平臺出來,這種優(yōu)勢就不存在了。所以現(xiàn)在來做人工智能,抓到這個先機(jī)是特別特別重要的。
人工智能如何快速商業(yè)化?
人工智能如何快速商業(yè)化
第一,不要用人工智能去取代人。
機(jī)器不一定要取代人,很多情況之下他只要能輔助人就可以了。我談到了很多工作會消失,但醫(yī)生會全部失業(yè)嗎?一定不會,應(yīng)該是最高明的醫(yī)生創(chuàng)造很多機(jī)器人給他人使用。記者就不再需要了嗎?寫深度文章還是需要的,但簡單拼拼湊湊的文字就不需要了。所以這些工具一定程度上是在輔助人而不是取代人。
第二,要聰明的找到容錯的用戶界面。
想想搜索引擎,搜索引擎的精確度其實(shí)是很低的,你想一想,當(dāng)你去百度,Google搜索的時候,它們給出的第一條就是你要的答案的情況有多少?我估計(jì)不會超過50%,但是為什么我們都說搜索引擎聰明,不說他笨呢?第一個理由當(dāng)然是因?yàn)樗W(xué),第二個則是因?yàn)樗慕缑孀龅姆浅5穆斆鳎核o用戶提供很多結(jié)果,而用戶只要能找到他滿意的那個,就會認(rèn)為搜索引擎很棒,因?yàn)闆]有它的話,用戶可能什么也找不到。這一類的容錯的界面,即便它的識別率很低,給你很多結(jié)果,讓你在一定時間里得到滿足,其實(shí)還是達(dá)到了一定的可用度。
第三,讓用戶提供自然的大數(shù)據(jù)。
當(dāng)Siri推出的時候很多人都說“這就是個玩具而已”,認(rèn)為它沒有真實(shí)的用處,但是蘋果靠Siri收集了很多人的真實(shí)語音,收集了大量數(shù)據(jù)。
很多人把Siri當(dāng)成一個搞笑工具,會問它諸如“你是男是女”這種無聊問題,蘋果就把這些無聊的問題深度分析了一下,去了解人們最常問的都是什么問題,然后他們就考慮能不能優(yōu)化Siri,讓它對正常問題的解答能讓人們在一定程度上得到滿足。人們滿足了以后,就會繼續(xù)的問,如此問題越問越多,蘋果也就可以得到更多的數(shù)據(jù)。
蘋果的這種數(shù)據(jù)收集方法非常聰明,值得借鑒。我們以前在學(xué)語音對話的時候,問的都是非常正經(jīng)的問題,到最后分析來分析去,不過是那固定的幾萬句,一直沒有跳出這個框框,得到的結(jié)果也就不會讓人滿意。但用一種有趣的方式,你就可以像草船借箭一樣,去“借”到幾億個數(shù)據(jù)。這些數(shù)據(jù)哪怕不精確也無妨,因?yàn)檎w來說深度學(xué)習(xí)非常聰明,能把那些不精確不精準(zhǔn)的東西忽略掉。
第四,關(guān)注局限領(lǐng)域。
Google很偉大,它要做全天候全路況的無人駕駛,它想把全部競爭對手都擊敗,最后就剩一個Google。這個計(jì)劃很宏偉,但是是不是一定要這么做呢?我覺得不見得。其實(shí)我們完全可以先做一個用于局限領(lǐng)域的無人車,把這樣的一個產(chǎn)品先做起來,然后我們通過它獲取數(shù)據(jù),學(xué)習(xí)教訓(xùn),不斷改進(jìn)。
想想無人駕駛叉車。這個叉車是產(chǎn)生價值的,因?yàn)樗〈艘粋€叉車工人去開叉車;它技術(shù)難度相對低,因?yàn)樗灰缽腁走到B;它不上路,不用擔(dān)心政府的法律法規(guī),不需要考慮撞到人怎么辦,是不是要停下。
Google Car能在高速公路上比99%以上的人都開的更好,但是它碰到一些極端的情況,比如大風(fēng)大雨的漆黑天,它就沒轍了,因?yàn)樗恢涝撛趺崔k,從來沒看到過這種情況。這種情況下只有把車子停下來,但那一停會發(fā)生什么呢?當(dāng)然就追尾了。
既然這種情況連Google也避免不了,為什么我們不先考慮做一些可控環(huán)境下的商業(yè)駕駛項(xiàng)目?這也是一個值得思考的問題,不是說Google的路線不對,而是說有兩種路線可以走。
總結(jié):人工智能的未來藍(lán)圖
李開復(fù):人工智能的未來藍(lán)圖
上圖是我認(rèn)為的人工智能的未來藍(lán)圖,這是我們創(chuàng)新工場現(xiàn)在對這一領(lǐng)域的理解,以及可能會發(fā)生的順序。
大數(shù)據(jù)應(yīng)用方面,現(xiàn)階段我們已經(jīng)看到很多互聯(lián)網(wǎng)應(yīng)用,BI、商業(yè)自動化馬上也會使用相關(guān)的技術(shù),未來幾年,離錢最近、產(chǎn)生用戶最多、產(chǎn)生價值最大的領(lǐng)域可能就是金融、醫(yī)療、教育,當(dāng)然也包括任何有大數(shù)據(jù)的行業(yè)。
在感知方面,今天的人臉識別、語音識別已經(jīng)做的蠻好。對于VR/AR,我們在短期還不是太樂觀,但是隨著它三五年以后慢慢得到普及,一定需要非常多的新的自然語言的界面。此外,我們大膽預(yù)測三到五年之內(nèi)會有一個人工智能平臺出現(xiàn)。
我們并不認(rèn)可家庭機(jī)器人會很快出現(xiàn),理由是消費(fèi)者的期望值是最高的,今天機(jī)器人的技術(shù)還不行,犯錯也太多,而且有時候會看起來太傻,另外價格也太貴,感應(yīng)器不夠靈敏。基于這些理由,我們對家用機(jī)器人的投資還只限于一些給小朋友的玩具,或者小魚在家這種用于溝通的工具,這一類的家庭應(yīng)用我覺得還是合理的,但要一個能夠在家里幫你掃地做菜的機(jī)器人出現(xiàn),恐怕還是一個非常長期的事情。任何行業(yè)都要有經(jīng)濟(jì)理由來投資這個領(lǐng)域,不斷迭代優(yōu)化它的技術(shù),再進(jìn)入下一個階段,所以機(jī)器人簡單來說應(yīng)該是工業(yè)、商業(yè),最后普及到家庭,所以今天很多對家庭機(jī)器人過火的觀點(diǎn)和做法我們是不認(rèn)可的。
關(guān)于無人駕駛,我們的觀點(diǎn)是雖然Google Car很偉大,但是因?yàn)樗ミm應(yīng)各種路況,所以要到應(yīng)用階段也還需要很長的時間。我們認(rèn)為可以先在局限環(huán)境中慢慢推進(jìn)無人駕駛。
從長期看,未來人工智能會在所有的領(lǐng)域徹底改變?nèi)祟悾a(chǎn)生更多的價值,取代更多人的工作,也會讓很多現(xiàn)在重復(fù)性的工作被取代,然后讓人去做人真正應(yīng)該去做的事情。短期來說,人工智能商業(yè)價值也很大,短期在很多領(lǐng)域都能產(chǎn)生價值。
李開復(fù)和清華大學(xué)姚期智院士
演講后問答實(shí)錄:
問題一:剛才聽到了人工智能的介紹,真的認(rèn)為人工智能給我們帶來了很多的便捷,的確是快要步入到一個黃金時代,很多人可以從勞動密集型的工作中解放出來。我的問題是,如果很多事兒都可以交給機(jī)器來完成,那么剩余的勞動力是否會催生另一個黃金產(chǎn)業(yè),比如服務(wù)業(yè)等等?
李開復(fù):這個問題很好,我曾經(jīng)寫過一篇文章《如果十年之后有一半的人失業(yè)了,下面該發(fā)生什么》,講過這個問題。悲觀的預(yù)測是,因?yàn)楝F(xiàn)在的95后,00后大部分成長在虛擬世界里,現(xiàn)實(shí)世界只是他們一個小小的補(bǔ)充,所以他們可能深陷其中而不能自拔了。反正人工智能讓他們失業(yè),也找不到工作,同時政府也可以養(yǎng)著他們,他們不需要工作,那么干脆每天帶著虛擬眼鏡起來就玩游戲,不思進(jìn)取就好了。這個是我特別擔(dān)心的,也是可能發(fā)生的。
樂觀的是上天讓我們來到這個世界,本來就不是讓我們來做中介、助理這類勞力的工作,我們被生為有感知,有大腦,應(yīng)該是有更高的目標(biāo)。那么,是不是上天讓人工智能來到我們面前,就是讓一批有思考能力的人幫人類找到一條新的出路,讓我們每個人能夠找到自己的更高目標(biāo),讓一半失業(yè)的人找到他們的歸宿,有自我實(shí)現(xiàn)的機(jī)會呢?
我對年輕人的建議是做最有熱情的事情,要不然機(jī)器肯定取代你,要做就要做頂尖最棒最有創(chuàng)意的事情,要不然你肯定會被取代。
問題二:您講了很多前景中的事情,我們都覺得美好,但是在實(shí)現(xiàn)前景的道路上,最大的幾個技術(shù)瓶頸在哪里?在解決瓶頸的過程中,您看到的大公司解決這些瓶頸的方案是什么?
李開復(fù):最大的瓶頸就是人工智能的平臺。平臺化會帶來井噴的效應(yīng),但這個平臺是什么我今天也無法描述。你可以看到iOS的平臺,安卓的平臺等等,每一次都造成了井噴式的效應(yīng),所以平臺化是必然的也是必須的。對于無人駕駛和機(jī)器人方面,主要是感應(yīng)器的價格等問題,一旦問題解決,這些領(lǐng)域也會發(fā)生井噴效應(yīng)。這些都需要聰明的大腦試著去解決。
問題三:第一個問題,您剛才提到人工智能的黃金時代到來了,那么您能舉一個到三個導(dǎo)致這種黃金時代到來的創(chuàng)新明星嗎?第二個問題,當(dāng)人工智能呼嘯而來的時候,大家很快意識到人工智能第一個急需解決的問題是人,如果人類把持不住,可能人的時代就過去了。
李開復(fù):今天有四位CEO,分別代表了芯片領(lǐng)域、金融領(lǐng)域、視覺識別領(lǐng)域和無人駕駛領(lǐng)域,這四個公司雖然目前領(lǐng)域不同,但在到達(dá)下一個階段后,一定會做平臺,一定要擴(kuò)張。任何一個領(lǐng)域都是先做一個切入的應(yīng)用,做好了之后再擴(kuò)大,變成一個平臺,最終獲利最多的就是那些有上下平臺連接的公司。
關(guān)于你的第二個問題,即人類將面臨的下一個挑戰(zhàn)問題,不是機(jī)器人占領(lǐng)了世界,我們被機(jī)器統(tǒng)治這樣的問題。雖然我不排除這些事情發(fā)生的可能性,但是我呼吁大家先要應(yīng)對一個現(xiàn)實(shí)問題——下一階段50%的人可能失業(yè)的問題。這可能是一個最大的問題,畢竟在過去的工業(yè)時代也好,信息時代也好,失業(yè)率從來沒有這么高過,今天的政治經(jīng)濟(jì)體系也不能承擔(dān)這么高的失業(yè)率。所以我覺得聰明的人應(yīng)該趕快解決這個問題,這個問題可能十年后就要到來了,當(dāng)這個問題解決完了之后,我們再去想下一個問題。
問題四:您講到的人工智能在各個領(lǐng)域都會以極快的速度超過人的領(lǐng)域,但是它是不是只在某些領(lǐng)域做的更好,在某些人類沒有開拓的領(lǐng)域,它有沒有自我開拓的能力,根據(jù)已有的領(lǐng)域和問題,開拓新的領(lǐng)域?“奇點(diǎn)”真的出現(xiàn),是不是就說明人工智能有跨領(lǐng)域思考學(xué)習(xí)的能力?
李開復(fù):從過去已經(jīng)發(fā)生的事情來看,還不存在人工智能的自我開創(chuàng),未來有沒有可能,這其實(shí)是一個蠻有意思的話題。我想即便是一些人類未曾進(jìn)入的領(lǐng)域,只要你能把它量化,變成一個input/output,我覺得機(jī)器還是可以學(xué)成的。但是我也相信大部分人類的偉大創(chuàng)意都不是那么容易量化的。
第二個關(guān)于奇點(diǎn)的問題,回到剛才講的,機(jī)器學(xué)習(xí)并不知道它自己在干什么,它只是一個非常聰明的input/output而已。另外它沒有自我意識。科幻小說和現(xiàn)實(shí)生活很大的差別是因?yàn)榭苹眯≌f里面的機(jī)器都有自我意識,所以我覺得,由于機(jī)器的自我意識和自我創(chuàng)造力,還有自我解釋的行動能力,這三者都不存在,奇點(diǎn)來臨也就不是那么容易的事情。我相信在未來的一百年,這三點(diǎn)都有可能被克服,也會給人類帶來機(jī)會和災(zāi)難,但是我們現(xiàn)在真正面臨的問題還是50%的人可能失業(yè)的問題。
評論