GPU要超越CPU擠身一線主角還得靠AI - 全文
GPU應(yīng)用因AI開(kāi)始有了截然不同的新轉(zhuǎn)變,不只讓一些支援高度平行運(yùn)算應(yīng)用的高階GPU相繼問(wèn)世,現(xiàn)在連整套GPU深度學(xué)習(xí)專用服務(wù)器也搶灘登陸,要助企業(yè)加快AI應(yīng)用。
AI人工智慧、虛擬/擴(kuò)增實(shí)境(VR/AR)與自動(dòng)駕駛技術(shù),在過(guò)去一年引起很高的市場(chǎng)關(guān)注,而一舉躍升成為當(dāng)前最火紅的熱門話題,特別是以深度學(xué)習(xí)(Deep Learning)為首的AI應(yīng)用,過(guò)去幾個(gè)月來(lái),因?yàn)镚oogle的AI電腦AlphaGo接連大敗歐洲和南韓國(guó)圍棋棋王,更在全世界吹起一股AI風(fēng)潮,使得現(xiàn)在不只有大型科技或網(wǎng)路公司要大力投資AI,就連各國(guó)政府也都要砸重金扶植AI產(chǎn)業(yè)。
目前一些大型科技或網(wǎng)路業(yè)者,例如Google、Facebook、亞馬遜AWS、IBM、微軟與百度等,都陸續(xù)已在云端服務(wù)中融入AI服務(wù),做為電腦視覺(jué)、語(yǔ)音辨識(shí)和機(jī)器人等服務(wù)用途,甚至,也開(kāi)始有越來(lái)越多規(guī)模較小的新創(chuàng)或網(wǎng)路公司,如Api.ai、Drive. ai、Clarifai與MetaMind等,打算將AI開(kāi)始應(yīng)用在各行各業(yè)的領(lǐng)域上。
GPU開(kāi)始在AI應(yīng)用逐漸嶄露頭角
然而,決定這些AI服務(wù)能不能獲得更好發(fā)揮的關(guān)鍵,不只得靠機(jī)器學(xué)習(xí)的幫忙,甚至得借助深度學(xué)習(xí)的類神經(jīng)演算法,才能加深A(yù)I未來(lái)的應(yīng)用。這也使得近年來(lái),GPU開(kāi)始在一些AI應(yīng)用當(dāng)中逐漸嶄露頭角。這是因?yàn)椴徽撌茿I、VR/AR,還是自動(dòng)駕駛技術(shù)的應(yīng)用,雖然各有不同用途,但他們普遍都有一個(gè)共同的特色,都是需要大量平行運(yùn)算(Parallel Computing)的能力,才能當(dāng)作深度學(xué)習(xí)訓(xùn)練模型使用,或者是將圖形繪制更貼近真實(shí)呈現(xiàn)。
所謂的平行運(yùn)算泛指的是將大量且密集的運(yùn)算問(wèn)題,切割成一個(gè)個(gè)小的運(yùn)算公式,而在同時(shí)間內(nèi)并行完成計(jì)算的一種運(yùn)算類型。而GPU則是最能夠?qū)⑵叫羞\(yùn)算發(fā)揮到極致的一大關(guān)鍵,這是因?yàn)镚PU在晶片架構(gòu)上,原本就被設(shè)計(jì)成適合以分散式運(yùn)算的方式,來(lái)加速完成大量且單調(diào)式的計(jì)算工作,例如圖形渲染等。所以,過(guò)去像是高細(xì)膩電玩畫(huà)面所需的大量圖形運(yùn)算,就成為了GPU最先被廣為運(yùn)用的領(lǐng)域,現(xiàn)在,VR/AR則是進(jìn)一步打算將原本就擅于繪圖運(yùn)算的GPU發(fā)揮得更淋漓盡致,來(lái)呈現(xiàn)出高臨場(chǎng)感的3D虛擬實(shí)境體驗(yàn)。
當(dāng)然在游戲繪圖運(yùn)算外,后來(lái)GPU也被拿來(lái)運(yùn)用在需要大量同質(zhì)計(jì)算的科學(xué)研究中使用。甚至近年來(lái),GPU也開(kāi)始因?yàn)樯疃葘W(xué)習(xí)的關(guān)系,而在一些AI應(yīng)用當(dāng)中擔(dān)任重要角色。
深度學(xué)習(xí)其實(shí)是機(jī)器學(xué)習(xí)類神經(jīng)網(wǎng)路的其中一個(gè)分支,深度學(xué)習(xí)本身是由很多小的數(shù)學(xué)元件組合成一個(gè)復(fù)雜模型,就像是腦神經(jīng)網(wǎng)路一般,可以建構(gòu)出多層次的神經(jīng)網(wǎng)路模型,來(lái)分別處理不同層次的運(yùn)算工作,這些神經(jīng)網(wǎng)路本身并不做判斷,只重覆相同計(jì)算工作,使得GPU在深度學(xué)習(xí)方面可以獲得很好的發(fā)揮,而隨著網(wǎng)路、云端和硬體技術(shù)成熟所帶來(lái)巨量的資料,也造就了現(xiàn)在所需完成訓(xùn)練的深度學(xué)習(xí)模型,比起以前更需要大量高階GPU的平行運(yùn)算能力,才足以應(yīng)付得了。
GPU平行運(yùn)算性價(jià)比贏過(guò)CPU
因?yàn)锳I、VR/AR與自駕車應(yīng)用需求提高后,也促使GPU重要性與日俱增,甚至為了因應(yīng)深度學(xué)習(xí)與AI應(yīng)用趨勢(shì),新世代GPU反而希望盡可能在晶片中裝入了更多電晶體和核心數(shù),來(lái)提高大量同性質(zhì)的資料計(jì)算能力。若是以Nvidia新的Tesla P100系列的GPU加速器產(chǎn)品來(lái)舉例說(shuō)明的話,在這個(gè)GPU加速器內(nèi)總共裝有3,584個(gè)CUDA核心數(shù)(單精度條件下),其內(nèi)含的電晶體數(shù)更一舉超過(guò)了150億顆,數(shù)量幾乎是前一代Tesla M40 GPU的翻倍,在雙精度條件下的浮點(diǎn)運(yùn)算能力,更高達(dá)有5.3 TFLOPs。
當(dāng)然GPU之外,CPU本身也具有計(jì)算處理的能力,不過(guò)在處理平行運(yùn)算時(shí),***大學(xué)資工系副教授洪士灝認(rèn)為,GPU的CP值(性價(jià)比)比CPU還要高。這是因?yàn)镚PU原本就擅長(zhǎng)處理大量高同質(zhì)性的資料計(jì)算工作,而CPU則擅于通用型任務(wù)的資料處理,所以對(duì)于一些需要大量單調(diào)式運(yùn)算工作的應(yīng)用,就很適合使用GPU來(lái)執(zhí)行,例如利用深度學(xué)習(xí)神經(jīng)網(wǎng)路訓(xùn)練模型來(lái)實(shí)現(xiàn)AI應(yīng)用,或者是用繪圖運(yùn)算呈現(xiàn)VR/AR所需的高細(xì)膩畫(huà)面,都很適合用GPU的方式來(lái)進(jìn)行計(jì)算。
另外從Nvidia官方所公布的一份CUDA C Programming Guide設(shè)計(jì)指南中也揭露了在2013年前的過(guò)去10年間,GPU與CPU兩者在單精度與雙精度浮點(diǎn)運(yùn)算(Floating-Point Operations Per Second,F(xiàn)LOPS)發(fā)展的比較差異。整體來(lái)看,GPU與CPU發(fā)展越到后期,兩者在浮點(diǎn)運(yùn)算處理能力的差距,有逐漸被拉大的趨勢(shì),這是因?yàn)樵降胶竺娌磐瞥龅男驴頖PU,更加強(qiáng)調(diào)浮點(diǎn)運(yùn)算的重要性,而盡可能要提高GPU浮點(diǎn)運(yùn)算的處理能力。所以,現(xiàn)在許多超級(jí)電腦內(nèi)都有使用GPU,來(lái)大幅提高浮點(diǎn)運(yùn)算的實(shí)力。
從Nvidia官方所公布的一份CUDA C Programming Guide設(shè)計(jì)指南中也部分揭露了在2013年前的過(guò)去10年間,GPU與CPU兩者在單精度與雙精度浮點(diǎn)運(yùn)算發(fā)展的比較差異。
整體來(lái)看,GPU與CPU發(fā)展越到后期,兩者在浮點(diǎn)運(yùn)算處理能力的差距,有逐漸被拉大的趨勢(shì),這是因?yàn)樵降胶竺娌磐瞥龅男驴頖PU,更加強(qiáng)了浮點(diǎn)運(yùn)算的能力。
今年GTC大會(huì)聚焦AI、VR/AR與無(wú)人汽車應(yīng)用
今年在美國(guó)圣荷西舉行的GTC技術(shù)大會(huì)(GPU Technology Conference),也因?yàn)锳I、VR/AR、無(wú)人汽車的關(guān)系而格外備受矚目。今年總共吸引了全球超過(guò)5千人參加,更有將近上百位的全球媒體、分析師到場(chǎng),還有多達(dá)2百家廠商參展,規(guī)模是歷年來(lái)最大。而做為主辦方的Nvidia今年氛圍也很不一樣,Nvidia不僅在現(xiàn)場(chǎng)同時(shí)發(fā)布多款與深度學(xué)習(xí)和AI有關(guān)GPU新品,還針對(duì)了原本就擅長(zhǎng)的VR/AR與自動(dòng)駕駛應(yīng)用領(lǐng)域推出了新的開(kāi)發(fā)工具和產(chǎn)品,希望就此能讓VR/AR與自動(dòng)駕駛可以更進(jìn)一步應(yīng)用。
也正因?yàn)锳I、VR/AR與自駕車讓GPU的應(yīng)用更廣了,因而造就了GPU在這次GTC大會(huì)扮演的重要性和應(yīng)用性明顯提高不少,特別是AI與深度學(xué)習(xí)的應(yīng)用方面,今年更成為會(huì)場(chǎng)上最炙手可熱的技術(shù)話題,在為期4天超過(guò)240場(chǎng)大小場(chǎng)的GPU主題講座中,有半數(shù)以上都圍繞著AI與深度學(xué)習(xí)而打轉(zhuǎn),這還不包括了來(lái)自2位人工智慧界的重量級(jí)AI大師,分別是IBM人工智慧研究和技術(shù)策略的IBM Watson 技術(shù)長(zhǎng)Rob High與豐田汽車研究機(jī)構(gòu)執(zhí)行長(zhǎng)Gill Pratt,今年都親自到場(chǎng)分享他們所觀察到的最夯AI技術(shù)和應(yīng)用新進(jìn)展。
Nvidia執(zhí)行長(zhǎng)黃仁勛在今年主題演說(shuō)中也強(qiáng)調(diào)GPU未來(lái)角色的重要性,將替深度學(xué)習(xí)與AI開(kāi)啟一種前所未有的全新運(yùn)算模式(Computing Model),將促使深度學(xué)習(xí)成為未來(lái)企業(yè)甚至每個(gè)人,都不能加以忽視的大事(Big Deal ),甚至將開(kāi)啟另一種AI即平臺(tái)的新服務(wù)模式(AI-as-a-Platform)。而為了搶攻AI與深度學(xué)習(xí)市場(chǎng),Nvidia今年甚至還罕見(jiàn)地,首度發(fā)表世上第一臺(tái)整套式深度學(xué)習(xí)專用的超級(jí)電腦DGX-1。
Nvidia執(zhí)行長(zhǎng)黃仁勛在今年主題演說(shuō)中數(shù)度強(qiáng)調(diào)GPU未來(lái)角色的重要性,將替深度學(xué)習(xí)與AI開(kāi)啟一種前所未有的全新運(yùn)算模式(Computing Model),將促使深度學(xué)習(xí)成為未來(lái)所有企業(yè)甚至每個(gè)人,都不能加以輕忽的大事(Big Deal ),甚至帶來(lái)一種AI即平臺(tái)的新服務(wù)模式(AI-as-a-Platform)。而為了搶攻AI與深度學(xué)習(xí)市場(chǎng),Nvidia今年甚至還罕見(jiàn)地,首度發(fā)表世上第一臺(tái)整套式深度學(xué)習(xí)專用的超級(jí)電腦DGX-1。
AI專用服務(wù)器將助企業(yè)加快深度學(xué)習(xí)應(yīng)用
Nvidia在這臺(tái)深度學(xué)習(xí)專用的超級(jí)電腦DGX-1內(nèi),使用了服務(wù)器專用的GPU加速器Tesla P100為基礎(chǔ)而打造完成,Tesla P100采用了新一代Pascal架構(gòu)設(shè)計(jì),比前一代Maxwell架構(gòu)的GPU加速器,在用來(lái)訓(xùn)練神經(jīng)網(wǎng)路的效能方面,Nvidia宣稱,Tesla P100足足有提升12倍之多。
Nvidia在這組超級(jí)電腦內(nèi)總共裝入8張Tesla P100加速卡,使得DGX-1在半精度(FP16)的浮點(diǎn)運(yùn)算次數(shù)每秒高達(dá)有170TFLOPS,如此高度的運(yùn)算能力,Nvidia甚至宣稱,只要有了DGX-1,就等同于擁用了250臺(tái)x86服務(wù)器而搭建的運(yùn)算叢集規(guī)模,將有助于企業(yè)在深度學(xué)習(xí)方面獲得更好的應(yīng)用效果。
而靠著DGX-1的高度運(yùn)算能力,也因而縮短了過(guò)去用來(lái)做為深度學(xué)習(xí)訓(xùn)練所需花費(fèi)的冗長(zhǎng)時(shí)間,若以單組2路Xeon E5服務(wù)器和DGX-1進(jìn)行比較的話,根據(jù)Nvidia測(cè)試的結(jié)果,在做為AlexNet機(jī)器學(xué)習(xí)的模型訓(xùn)練方面,DGX-1完成訓(xùn)練所花費(fèi)的時(shí)間要遠(yuǎn)比Xeon E5服務(wù)器還快許多,Xeon級(jí)服務(wù)器得要花150小時(shí)才能做完的訓(xùn)練,DGX-1只須2小時(shí)就能完成。若以訓(xùn)練機(jī)器辨識(shí)照片來(lái)舉例的話,所代表的是,每天被喂給DGX-1機(jī)器做訓(xùn)練的照片,數(shù)量高達(dá)有13億張。
除了GPU以外,這臺(tái)DGX-1還有配置了一個(gè)2路Xeon E5 CPU處理器,系統(tǒng)記憶體部分最大則可支援512GB DDR4的記憶體容量,并也配備有7TB大小的SSD硬碟,至于電力供給部份則是使用一臺(tái)3U高度3,200瓦的電源供應(yīng)設(shè)備,還支援了NVLink 混合式立方網(wǎng)格 (NVLink Hybrid Cube Mesh)技術(shù),可提供更高速GPU互連的能力,網(wǎng)路部分則提供了雙10GbE連接埠和一個(gè)100Gb的Quad InfiniBand高速網(wǎng)路介面,而使得每臺(tái)DGX-1機(jī)器的總傳輸頻寬,每秒最高可達(dá)768GB。
不僅如此,Nvidia在這臺(tái)DGX-1中加入許多新的深度學(xué)習(xí)軟體功能,像是新增加的Nvidia深度學(xué)習(xí)GPU訓(xùn)練系統(tǒng)(Deep Learning GPU Training System,DIGITS),可用來(lái)協(xié)助企業(yè)設(shè)計(jì)一個(gè)完整且互動(dòng)的神經(jīng)網(wǎng)路,還支援了 CUDA深度神經(jīng)網(wǎng)路圖庫(kù)(CUDA Deep Neural Network library,cuDNN )的v5新版本,可用來(lái)做為設(shè)計(jì)神經(jīng)網(wǎng)路時(shí)可供GPU加速的函式圖庫(kù)。DGX-1系統(tǒng)內(nèi)也提供了一些深度學(xué)習(xí)優(yōu)化的框架,例如Caffe、Theano與Torch等,另還搭配一套云端管理存取的工具和一個(gè)容器應(yīng)用儲(chǔ)存庫(kù)(Repository )。
Nvidia這臺(tái)深度學(xué)習(xí)專用的超級(jí)電腦DGX-1,主要是使用了服務(wù)器專用GPU加速器Tesla P100來(lái)打造完成的AI專用服務(wù)器,因而在這臺(tái)機(jī)器內(nèi)總共裝入8張Tesla P100加速顯卡,使得DGX-1在半精度(FP16)的浮點(diǎn)運(yùn)算次數(shù)每秒可高達(dá)170TFLOPS,如此高度的運(yùn)算能力,Nvidia甚至宣稱,這幾乎等同于用250臺(tái)x86服務(wù)器而搭建的運(yùn)算叢集規(guī)模,將助企業(yè)獲得更好的深度學(xué)習(xí)作用。
GPU將擠身成為AI服務(wù)器界的一線主角
而從Nvidia這次所發(fā)布DGX-1的銷售策略來(lái)看,除了要積極搶攻深度學(xué)習(xí)與AI市場(chǎng)外,也不難看出Nvidia想要透過(guò)推出整套式AI專用的GPU服務(wù)器,好讓自己也開(kāi)始變身成為一家能提供特殊GPU解決方案的服務(wù)器供應(yīng)商。
而這樣的作法所帶來(lái)的其中一個(gè)改變,便是也開(kāi)始讓GPU應(yīng)用位置有了截然不同以往的轉(zhuǎn)變。相較于過(guò)去GPU只在游戲或研究領(lǐng)域受到重視,但在服務(wù)器應(yīng)用當(dāng)中,GPU始終淪為配角,CPU才是主角,CPU處理器規(guī)格決定了一臺(tái)服務(wù)器工作效能的高低,但現(xiàn)在,在一些特殊深度學(xué)習(xí)或AI專用的服務(wù)器當(dāng)中,GPU受重視的程度有時(shí)反而還高過(guò)了CPU,GPU反倒竄升成為一線主角。
以前,CPU是服務(wù)器效能高低的關(guān)鍵,但現(xiàn)在,在這些深度學(xué)習(xí)或AI等特定用途的服務(wù)器當(dāng)中,GPU則是變成了關(guān)鍵,GPU擁有的核心數(shù)量多寡,決定了能不能將深度學(xué)習(xí)與AI更進(jìn)一步延伸應(yīng)用,CPU反而變成了配角,兩者位置恰恰好顛倒了過(guò)來(lái),不過(guò)這種情況,目前只有在一些特殊運(yùn)算用途的AI設(shè)備中才看得到,但也確實(shí)反應(yīng)了GPU應(yīng)用位置,正在逐漸改變當(dāng)中。
當(dāng)然,除了AI與深度學(xué)習(xí)需要用到GPU外,另一個(gè)需要用到GPU的VR/AR應(yīng)用也成為今年GTC大會(huì)的另一大熱門焦點(diǎn)。除了現(xiàn)場(chǎng)有Nvidia技術(shù)人員展示結(jié)合GPU技術(shù)的各類VR應(yīng)用外,展區(qū)內(nèi)也設(shè)有VR Village體驗(yàn)區(qū),參加者可以現(xiàn)場(chǎng)試用Oculus與HTC Vive這兩款已正式出售的VR頭戴式裝置,現(xiàn)場(chǎng)體驗(yàn)VR帶來(lái)的沉浸式視覺(jué)效果。
而從這些VR展示體驗(yàn)當(dāng)中,也說(shuō)明了VR技術(shù)已開(kāi)始跨入大眾化的實(shí)用階段,而且不只運(yùn)用在游戲娛樂(lè)領(lǐng)域,其他專業(yè)領(lǐng)域也開(kāi)始能與VR結(jié)合,像是Nvidia在這次大會(huì)中就推出了一個(gè)Iray VR新應(yīng)用,能將原本設(shè)計(jì)好的3D場(chǎng)景或物件模型,經(jīng)過(guò)Iray渲染技術(shù),在虛擬實(shí)境中呈現(xiàn)貼近真實(shí)情境的影像渲染效果,讓VR不只是當(dāng)作游戲使用而已,未來(lái)就連設(shè)計(jì)后的3D制圖也能用VR渲染技術(shù)呈現(xiàn)。當(dāng)然在持續(xù)提高VR影像畫(huà)面細(xì)膩度和更快速的即時(shí)反應(yīng)的同時(shí), VR技術(shù)的下一步也需要搭配更高階的GPU,才能達(dá)到更深度沉浸式的高臨場(chǎng)感體驗(yàn)。
除此之外,在無(wú)人汽車應(yīng)用方面也有新進(jìn)展。Nvidia將參與協(xié)助打造首輛賽車用的無(wú)人汽車的計(jì)畫(huà),將采用Nvidia自動(dòng)駕駛平臺(tái)Drive PX2做為汽車電腦系統(tǒng)核心,未來(lái)這輛無(wú)人賽車完成以后,重量預(yù)估將達(dá)1噸重,并且將會(huì)參加即將在2016至2017年賽季,由Formula E電動(dòng)方程式首度舉辦的Roborace無(wú)人駕駛賽事。這場(chǎng)無(wú)人賽車比賽,預(yù)估將會(huì)有10支隊(duì)伍,共20輛的無(wú)人汽車參賽,共同在同個(gè)賽車場(chǎng)上較勁。每輛無(wú)人賽車硬體配備都完全相同,所以最后決勝關(guān)鍵將決定于哪只隊(duì)伍可以運(yùn)用機(jī)器學(xué)習(xí),甚至借助深度學(xué)習(xí)的類神經(jīng)演算法,盡可能提高駕駛判斷的預(yù)測(cè)能力,才能做到在以毫秒為競(jìng)速單位的賽車場(chǎng)上稱王。
Nvidia這次還首度用VR來(lái)呈現(xiàn)火星地理環(huán)境,讓穿戴者可以沉浸在有如真實(shí)火星圍繞的視覺(jué)感受當(dāng)中,這些環(huán)境資料都是從搜集科學(xué)專用衛(wèi)星的精確影像資料,以及火星任務(wù)取得數(shù)年的探測(cè)數(shù)據(jù),所建構(gòu)出貼近火星地形和氣候的虛擬實(shí)境。Nvidia執(zhí)行長(zhǎng)黃仁勛現(xiàn)場(chǎng)還與蘋果共同創(chuàng)辦人Steve Wozniak遠(yuǎn)端視訊連線,并邀請(qǐng)他現(xiàn)場(chǎng)示范如何用VR來(lái)玩火星探險(xiǎn)游戲,沒(méi)想到Steve Wozniak卻顧不得旁人,自己就在現(xiàn)場(chǎng)玩開(kāi)了 ,惹得現(xiàn)場(chǎng)笑聲一片,連人稱科技頑童的他也難以抵擋VR的魅力,也正說(shuō)明了VR技術(shù)已開(kāi)始走入實(shí)用階段。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
相關(guān)閱讀:
- [電子說(shuō)] Blackwell GB100能否在超級(jí)計(jì)算機(jī)和AI市場(chǎng)保持領(lǐng)先優(yōu)勢(shì)? 2023-10-24
- [電子說(shuō)] 如何使用Rust創(chuàng)建一個(gè)基于ChatGPT的RAG助手 2023-10-24
- [電子說(shuō)] 訊飛星火大模型V3.0正式發(fā)布,全面對(duì)標(biāo)ChatGPT 2023-10-24
- [電子說(shuō)] 如何創(chuàng)建FPGA控制的機(jī)器人手臂 2023-10-24
- [電子說(shuō)] 亞馬遜云科技生成式AI最新案例分析,助力企業(yè)業(yè)務(wù)創(chuàng)新迭代 2023-10-24
- [電子說(shuō)] 怎樣延長(zhǎng)半導(dǎo)體元器件的壽命呢? 2023-10-24
- [電子說(shuō)] 新思科技攜手臺(tái)積公司加速N2工藝下的SoC創(chuàng)新 2023-10-24
- [電子說(shuō)] 服務(wù)器硬盤通用基礎(chǔ)知識(shí) 2023-10-24
( 發(fā)表人:包永剛 )