人工智能(AI)很熱,但很多時候我們覺得人工智能還不夠“智能”,比如說蘋果手機,一家公司的創(chuàng)始人楊靜前一段時間就把Siri卸載了,因為它不夠智能,有時候還會添亂,一按它就跳出來,使得人工智能似乎變成了“人工智障”,感覺還不如不出現(xiàn)的好。
這就說明在人工智能技術(shù)的研發(fā)及應(yīng)用方面遇到了一些技術(shù)挑戰(zhàn),很多專家都在自己深耕的領(lǐng)域?qū)?a href="http://m.xsypw.cn/soft/data/42-102/" target="_blank">AI技術(shù)進(jìn)行著自己的探索,很多探索是很超前的,那么,我們怎樣才能跨越這樣的艱難險阻,達(dá)到AI的一種新境界呢?
火爆下的隱憂
AI這么火,一切的根源在于數(shù)據(jù),龐大的數(shù)據(jù)洪流。我們身處在智能萬物互聯(lián)的時代,一切東西都聯(lián)在網(wǎng)上,而且越來越智能,都在收集數(shù)據(jù)、分析數(shù)據(jù)。所以人工智能這個技術(shù)的關(guān)鍵性就在于怎么更好的把收集的數(shù)據(jù)挖掘、分析,然后利用起來,實現(xiàn)增值,從而帶來增值的業(yè)務(wù),這是大家如此關(guān)注人工智能的一個重要原因。
目前,人工智能還處在發(fā)展的初期。隨著計算機時代的發(fā)展變得愈加成熟,很多技術(shù)的部署變得非常困難,因為很多技術(shù)都是在整個人工智能的框架之下的,但是在整個AI相關(guān)的領(lǐng)域當(dāng)中,只有7%的應(yīng)用才是符合AI的具體要求的。為了更好地實現(xiàn)人工智能,需要非常強大的計算能力才能夠處理如此大型的數(shù)據(jù)。預(yù)計到2020年,用于人工智能的計算循環(huán)將會增長12倍之多。
英特爾的執(zhí)著
大概在一年之前,英特爾收購了人工智能公司Saffron Technology。Saffron是AI領(lǐng)域平臺服務(wù)的佼佼者,他們特別關(guān)注在基于技術(shù)的邏輯和推理的處理能力,非常關(guān)注數(shù)據(jù)的分析,同時也希望能夠加入大家對于數(shù)據(jù)的理解,比如說對于欺詐的分析及其在銀行業(yè)當(dāng)中的具體應(yīng)用,很多成功的案例都是在Saffron Technology的推動下得以完成的。近期,該行業(yè)巨頭又收購了Nervana Systems。
對于這次并購,英特爾公司副總裁,數(shù)據(jù)中心事業(yè)部數(shù)據(jù)中心解決方案部門總經(jīng)理Jason Waxman表示,在這次Nervana Systems的收購中最激動人心的一點是,我們認(rèn)為這家公司是符合我們的戰(zhàn)略思路的,尤其在解決方案的初期一直到整個軟件基礎(chǔ)設(shè)施的構(gòu)架,同時可以增加我們的數(shù)據(jù)庫,并助力我們半導(dǎo)體的優(yōu)化。因此,我們通過這么大量的IP的收購,最后將整個產(chǎn)品組合買下。這個收購結(jié)束完之后,我覺得在前90天我們就已經(jīng)把這種非常好的技術(shù)進(jìn)行了破壁式的發(fā)展,我想這也是增加了英特爾的處理和戰(zhàn)略的能力。
與此同時,英特爾還并購了Movidius,這項收購案尚未完全完成,但是完成之后這項收購對于推動智能設(shè)備的發(fā)展將會非常關(guān)鍵。Movidius在嵌入式計算機領(lǐng)域是非常關(guān)鍵的,英特爾將會在智能照相機和圖象識別,以及物聯(lián)網(wǎng)領(lǐng)域都使用Movidius技術(shù)。因此將會持續(xù)擴大其在這個領(lǐng)域的投資。
Jason Waxman表示,構(gòu)建基于英特爾架構(gòu)的涵蓋至強處理器、至強融核處理器、Nervana平臺和FPGA、Omni-Path網(wǎng)絡(luò)、3DXPoint存儲等技術(shù)的硬件平臺,結(jié)合英特爾針對深度學(xué)習(xí)/機器學(xué)習(xí)而優(yōu)化的英特爾數(shù)學(xué)函數(shù)庫(Intel.MKL)、數(shù)據(jù)分析加速庫Intel.DAAL)等,和致力于為多節(jié)點架構(gòu)提供卓越性能的開源軟件框架,如Spark、Caffe、Theano以及Neon等,及可推動前后端協(xié)同人工智能發(fā)展布局的Saffron、TAP、Nervana系統(tǒng)、Movidius等工具和平臺,以上這些產(chǎn)品組合可幫助企業(yè)更方便地獲取、開發(fā)和部署人工智能應(yīng)用,將人工智能潛能在各個領(lǐng)域充分釋放,如智能工廠、無人駕駛汽車、體育、欺詐檢測、生命科學(xué)等。
技術(shù)的創(chuàng)新機遇
現(xiàn)在技術(shù)的發(fā)展日新月異,我們看到大量的創(chuàng)新和新的改革。有些技術(shù)其實已經(jīng)存在有幾年了,現(xiàn)在正是開拓新市場機遇的時機。
機器學(xué)習(xí)
機器學(xué)習(xí)有不同的理念和觀點,通常就是指從數(shù)據(jù)當(dāng)中學(xué)習(xí)的方法,它能夠構(gòu)建這些數(shù)據(jù),并且通過數(shù)據(jù)改進(jìn)自己的性能,包括如何從數(shù)據(jù)當(dāng)中進(jìn)行系統(tǒng)化和架構(gòu)的學(xué)習(xí),這是非常寬泛的一個定義,并且這個概念在學(xué)術(shù)界已經(jīng)存在很久了。直到最近,生活和工作當(dāng)中能夠產(chǎn)生更多的數(shù)據(jù),因此就推動了機器學(xué)習(xí)的需要。
機器學(xué)習(xí)有三種不同類型,Nervana Systems公司的前CEO、人工智能專家Naveen Rao表示,對此,我不能說只有這三種類型,但是這可以讓大家稍微了解一下機器學(xué)習(xí)的世界。我們在最近的許多新聞當(dāng)中可以看到一個叫做監(jiān)督學(xué)習(xí)的概念。比如說我有一些圖片、標(biāo)識,這個標(biāo)識是貼在我的數(shù)據(jù)上的,例如一個人的面部識別,這個數(shù)據(jù)的標(biāo)識就代表他的名字,這個名字可以聯(lián)到計算機當(dāng)中,計算機就能夠?qū)W習(xí),或者將這種輸入的數(shù)據(jù),將它的名字和圖片連在一起。非監(jiān)督學(xué)習(xí)則處于我們的技術(shù)前沿,很難去真正找到具有潛在的、可使用的一種數(shù)據(jù)架構(gòu),而且前提是你一開始還不了解這個架構(gòu)的詳情。
如果你想學(xué)一種語言,你先要聽它,了解它的發(fā)音,了解語音語調(diào),至少要形成一個語言的框架之后才能開始真正學(xué)習(xí)這個語言。事實上,我們很難賦予機器學(xué)習(xí)這項能力,但是我們還在不斷推動這方面的研究。
接下來講一下強化學(xué)習(xí)。就像培訓(xùn)你自己家的寵物一樣,你希望它有一個正面、你想要的反映,如果它給了負(fù)面的、你不想要的反映,你就要懲罰它,這就是強化學(xué)習(xí)的概念。我想真正的AI不僅僅是這三種類型。而事實上,讓我們的生活、我們的世界更加好也就是機器學(xué)習(xí)和人工智能的最終目標(biāo)。
舉一個例子,是非常傳統(tǒng)經(jīng)典的機器學(xué)習(xí)。這里可以給大家看一些圖片。大家可以看到這是我們其中的一個創(chuàng)始人,我們?nèi)绾谓虝C器能夠識別人的面孔,也就是說,讓機器將名字和面孔連接在一起。按照傳統(tǒng)方法來說,我要看一下他面部的特點,也就是眼睛和眉毛的寬度和鼻子的長度,這些都是非常重要的辨識特點,通過軟件進(jìn)行辨識,把它變成一種圖像的關(guān)鍵點,我們把它叫做面部識別特點的函數(shù)。
最后我們通過不同的分類器,和一些集成的方法,最終能夠辨別出他的名字。我想人類或者是動物能夠更好的辨別這個面孔,但是機器需要很多的學(xué)習(xí),因為它們沒有辦法直接提取出這些特點。傳統(tǒng)的經(jīng)典機器學(xué)習(xí)就是以這種方式進(jìn)行面部識別的。
機器能力向人類看齊
未來,要想讓機器具備像人一樣的能力,這個能力體現(xiàn)哪幾方面呢?英特爾中國研究院院長宋繼強先生將其概括為四大能力:首先是感知外界環(huán)境的能力;二是根據(jù)感知來的能力進(jìn)行推理;三是推理形成一些決策觸動機器做反饋,這個反饋可以是動的,也可以是不動的,比如說視覺的反饋、聲音的反饋;最后一個更重要的是能適應(yīng)環(huán)境,要能根據(jù)環(huán)境的變化,交互的人的變化去相應(yīng)的做適應(yīng),這個非常重要,要不然就會變成一個死的程序。
這里面有一條橫線很重要,“記憶”,記憶是一個非常突出的重點。Jeff Hawkins,就是Numenta的創(chuàng)始人,他寫了一本書叫《人工智能的未來》,就是專門講人工智能或者說智能怎么去看待他,其實就表現(xiàn)在能夠利用記憶去進(jìn)行預(yù)測,如果能做到這一點,這個機器就真的有智能了。所以記憶這個能力非常重要,我們現(xiàn)在看到很多做人工智能的廠商也都把這個加入到系統(tǒng)方案里面。
深度學(xué)習(xí)
深度學(xué)習(xí)的好處是深層的,這樣可以在很多不同的抽象層提取特征,而這個特征不是人去定義的,以前很多做人工智能和機器學(xué)習(xí)的人是去找Future,所以有Futureengineer的工作,但現(xiàn)在可以不需要了,它可以讓特征是自己從數(shù)據(jù)中發(fā)現(xiàn),并且通過越來越多的數(shù)據(jù)提升系統(tǒng)的性能,而不是靠一兩個Futureengineer。
同時,深度學(xué)習(xí)也越來越具備強大的表示能力,從原來只能表示靜態(tài)的圖像和簡單的語句,到現(xiàn)在有能力去表示連續(xù)的圖像,也就是視頻,甚至加上多模態(tài)這種方式。深度學(xué)習(xí)是一種突破性的技術(shù),它的突破表現(xiàn)在在數(shù)據(jù)足夠大的情況下,已經(jīng)可以在某些層面超過人的能力,比如說在做人臉識別方面,在ImageNet上面已經(jīng)超過了人的能力。在語音方面,語音識別、機器翻譯也都達(dá)到了讓人滿意的水平。所以,隨著計算量和數(shù)據(jù)量的增加,深度學(xué)習(xí)方面已經(jīng)看到了巨大的突破。
我們期望性能隨著數(shù)據(jù)增多而提升,同樣數(shù)據(jù)多了訓(xùn)練時間也變長,當(dāng)訓(xùn)練時間變長,一種情況下可以通過增加處理器的數(shù)量去擴展它的性能,讓它仍然保持在一兩天內(nèi)可以把這個模型訓(xùn)練出來,如果處理器數(shù)量達(dá)到了一定程度,這個時候它的瓶頸不再是計算能力了,而變成了I/O能力,就是處理器和處理器之間通訊,或者是處理器訪問內(nèi)存的I/O變成了瓶頸,這個時候你再增加處理器的數(shù)量也看不到性能的增長,還是要那么多時間才能訓(xùn)練出來。Nervana技術(shù)就可以更高效的去定義內(nèi)存的訪問帶寬和計算的密度,讓它很好的去匹配現(xiàn)在的數(shù)據(jù)量增大的需求。同時可以讓多個節(jié)點并行支持這種大模型的訓(xùn)練,所以我們可以看到近乎一種線性的性能擴展。
下圖是一個基于張量運算的架構(gòu),張量運算是一個多于二維塊狀的運算,矩陣運算都屬于張量運算。里面這些綠色的部分都是專門針對矩陣運算的處理單元。同時我們還用了一種叫Flexpoint技術(shù),這個技術(shù)既不是定點的,也不是雙精度浮點的,它其實是基于這兩者之間可以變化的技術(shù),所以在這個里面它可以提供前所未有的并行化的水平,計算密度非常高,是目前最好的一種硬件加速水平的10倍。
同時,由于計算單元是專門針對張量運算所設(shè)計的,所以它的功耗非常低。同時我們看到旁邊有黃色的4塊,這個是高帶寬內(nèi)存,專門通過專用的內(nèi)存訪問接口連接到主芯片上,中間灰色大區(qū)域可以把它看作是一個芯片。這些內(nèi)存是直接由軟件管理的,所以整個計算里面不會存在Cache,不會存在不可預(yù)測的Cachemiss,完全由程序去控制去哪里讀數(shù)據(jù),什么時候數(shù)據(jù)好了,我放回去。
你會想到這一個芯片可能處理不了所有的深度學(xué)習(xí)訓(xùn)練任務(wù),那我用多個芯片。多個芯片之間的互聯(lián)就是靠RCL,我們專門定制了一種Interchip Link,它的速度比傳統(tǒng)的PCIE要快20倍,而且是雙向的數(shù)據(jù)帶寬通道,有這樣技術(shù)以后,我可以把一個芯片最多可以跟12個芯片連在一起,這樣可以組成一個很大的超網(wǎng)格做訓(xùn)練。
軟件/算法對AI發(fā)展的重要性
同時,有了硬件之后,我們不能放松對軟件AI算法的研究,因為硬件提供了一個基礎(chǔ),如果你用設(shè)計得很差的算法去運行,實際上也是浪費它的資源。所以在英特爾研究院以及軟件部門也在一起進(jìn)行AI算法的各種研究,其中包括這4大類,第一大類是怎樣讓訓(xùn)練做得更快,讓它需要更少的數(shù)據(jù)和人的監(jiān)督。因為現(xiàn)在做訓(xùn)練通常還需要大量的數(shù)據(jù),需要label好的數(shù)據(jù),但是我們很多非人工智能領(lǐng)域的人就問了,小孩子去識別哪需要這么多圖片,給兩三張圖片看看就懂了,也不需要那么長時間,所以這里面應(yīng)該還有更多的技術(shù)點可以去鉆研。怎么樣去增強現(xiàn)在的深度神經(jīng)網(wǎng)絡(luò),因為這只是其中一個工具,未必是最終的工具。
深度神經(jīng)網(wǎng)絡(luò)+X,加什么呢?另外再加上一些記憶,或許這里面就有更好的適合于去學(xué)習(xí)產(chǎn)生知識并且進(jìn)行推理的模型能夠出來。另外,我們知道大的模型訓(xùn)練出來以后是很稀疏的,它里面很多參數(shù)是0,對于這些0傳輸它或者存儲它甚至做運算都是毫無價值的,所以我們就要想辦法讓模型更稀疏,讓它存儲起來更壓縮,同時我們可以在模型里面做裁剪,裁剪的時候一些0的地方就不運算了,所以運算量也會減少。
另外一個維度是計算的精度下降,這也是目前很熱的一個研究點,原來我們用16位去計算,現(xiàn)在我們看看用8位、4位、2位甚至到1位,是否也能夠完成這個模型的運算,同時我來保證性能、準(zhǔn)確度不會下降太多,這也是目前我們在研究的一個重點。同時還看怎么樣能夠讓它去擴展,采用更大的Bach Size和High-order方法去做深度學(xué)習(xí)的訓(xùn)練。
AI何時飛入尋常百姓家
今年,從AlphaGo開始,AI就成為社會焦點議題了,現(xiàn)在AI雖然炒得很熱,但是它的應(yīng)用仍局限在一些比較窄的專業(yè)領(lǐng)域,比如圖象識別、語音識別,或者是無人駕駛、智能駕駛,神經(jīng)語言學(xué)等,那么,AI在大眾生活方面有沒有相關(guān)的應(yīng)用呢?
處在嬰兒期的深度學(xué)習(xí)應(yīng)用
對于AI在百姓生活中的應(yīng)用情況,英特爾數(shù)據(jù)中心事業(yè)部首席工程師兼人工智能解決方案架構(gòu)師張彤表示,現(xiàn)在深度學(xué)習(xí)的應(yīng)用還處在嬰兒階段,我們預(yù)計在未來幾年時間里面,在各個領(lǐng)域會有更深入、更廣泛的應(yīng)用。目前英特爾主要是在圖像、語音或者自然語言處理等,特別是跟我們的云的提供商(Cloud Provider)它們之間的合作比較多。
下一步我們會更多的深入到行業(yè)應(yīng)用當(dāng)中去,比如說醫(yī)療領(lǐng)域的應(yīng)用,這個跟我們大家的生活是息息相關(guān)的,比如醫(yī)學(xué)影像的識別,現(xiàn)在很多時候機器判斷癌癥,我就看到國內(nèi)有的教授在這方面研究做得非常好,就是用機器學(xué)習(xí)來判斷癌癥,比一般的醫(yī)生判斷得都要準(zhǔn)確。
商湯科技讓AI落地
商湯科技主要做人工智能落地的產(chǎn)品,比如說直播領(lǐng)域,對此,該公司異構(gòu)并行計算部門工程總監(jiān)劉文志表示,女主播是否漂亮是非常重要的,商湯的人臉識別技術(shù)可以精準(zhǔn)美化女主播的顏值,這是實際中已經(jīng)在大范圍使用的,當(dāng)然也借了今年直播的風(fēng)口。
另外,我們在一些人臉閘機,用于通關(guān),如果我們自己掏出身份證或者其他設(shè)備,相對來說是比較復(fù)雜的,如果靠著我們自己的一張臉就可以暢通無阻的話,包括在某種情況下自己的家門都不用帶鑰匙了。還有一些和圖像相關(guān)的,當(dāng)然商湯科技也能提供很好的解決方案。比如說Pikazo。
京東的AI謀略
京東集團AI/VR/AR實驗室人工智能方向研發(fā)總監(jiān)陳宇表示,作為一個技術(shù)的研發(fā)從業(yè)者,我感覺這個事情分兩層看,首先從感知角度,感知本身就是人工智能領(lǐng)域的一個非常重要的方向,比如說視覺、聽覺,我們對事物的分析,也就是說圖象識別、語音識別,我們京東都有在落地。
舉個例子,我們的圖象識別不只是大家看到的一些人臉識別或者文字識別,或者是圖像的一些簡單識別,我們甚至可以幫助我們的倉儲系統(tǒng)進(jìn)行貨品的審核和分揀,這些東西都是具體落地場景。同時除了感知之外,我們京東也有很多其他的應(yīng)用,舉一個例子,京東有吉米機器人,它可以替代人工進(jìn)行Q&A的服務(wù),可以節(jié)省大量的人工,這些不只是感知,同時也是做了智能信息的處理,這些都是人工智能在京東實際的落地場景,也是大家能夠直接體會到的東西。
來自中科院的聲音
中國科學(xué)院計算技術(shù)研究所研究員,博士生導(dǎo)師,計算機體系結(jié)構(gòu)國家重點實驗室副主任馮曉兵博士表示,因為我是做研究的,所以在具體的應(yīng)用上,我只能說一些別人的例子,像我們現(xiàn)在用的智能手機,手寫體識別、語音的輸入,這后面都是有人工智能的支持,包括像京東也好,國內(nèi)很多電商網(wǎng)站,商品推薦,其背后多少都是有人工智能的幫忙,讓它做得更精準(zhǔn)。包括有些旅游、簡單的問答系統(tǒng)、客服等等,我相信后面都是有人工智能支持的。
但是我想,未來可能我們在新的制造業(yè)、工業(yè)的升級上面應(yīng)該也會有它的作用。
馮曉兵表示,我覺得人工智能繼續(xù)發(fā)展會有兩大趨勢,第一是怎么讓更多的應(yīng)用,從人工智能本身的理論、方法,能處理更多的應(yīng)用,現(xiàn)在主要是基于學(xué)習(xí)的方法比較成功,除了學(xué)習(xí)方法之外,我們還有沒有別的可以讓它往前走的,但這個可能跟我們關(guān)系不大。我們可能跟英特爾比較類似,因為計算所都是做系統(tǒng)的,所以說第二個大方面的問題是我們怎么做一個更合理的系統(tǒng),使得已經(jīng)有的人工智能的應(yīng)用,讓它在一個可接受的代價的前提下得到更廣泛的應(yīng)用,
像芯片、系統(tǒng)軟件,包括編程框架的支持,像這些方面可能都面臨很多挑戰(zhàn)。不管是計算所在做的,還是企業(yè)界提到的,都是在嘗試怎么做一個更好的系統(tǒng),使得我們可以用更小的功耗、更低的程序開發(fā)代價,獲得更好的性能,可以做更大的數(shù)據(jù)規(guī)模的處理。另一方面,因為有很多不同的種類,我們有沒有一些基礎(chǔ)的技術(shù),使得一些系統(tǒng)可以在不同的應(yīng)用種類上面獲得更好的適應(yīng)性,而不需要太多的程序員或者系統(tǒng)工程師深度的介入,這將來都會面臨很大的挑戰(zhàn)。
對未來的期待
2020年快來了,人工智能在哪個領(lǐng)域會出現(xiàn)更新的、更引人注目的突破呢?
對此,馮曉兵表示,我最希望的一點還是在醫(yī)療方面,因為醫(yī)療確實有很多新聞事件,對于每一個家庭來說都是非常重要的事情,通過人工智能,能夠作為醫(yī)療的輔助和管理系統(tǒng),可能沒辦法完全替代醫(yī)生,但是我們可以通過人工智能的輔助,使得我們平均的醫(yī)生水準(zhǔn),以及每個人受到的醫(yī)療服務(wù)的水準(zhǔn)得到比較好的改善,能夠讓大家更安心的、花更少的錢得到更好的服務(wù),這是我的期望。
評論