日前,英偉達(dá)GTC 2018(GPU Technology Conference 2018,以下簡(jiǎn)稱(chēng)GTC)在美國(guó)圣何塞舉行。英偉達(dá)再一次在提升計(jì)算力的路上越走越遠(yuǎn)。GPU產(chǎn)品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都進(jìn)行了更新。
新產(chǎn)品—全世界最大的GPU只要399
全新Tesla V100顯存將從原來(lái)的16GB提升至32GB。2017年5月11日,英偉達(dá)正式發(fā)布了全新Volta架構(gòu)GPU——NVIDIA Tesla V100,它擁有超過(guò)210億個(gè)晶體管,是上代TeslaP100的1.37倍。它的單精度浮點(diǎn)性能高達(dá)15 TFLOPS,雙精度浮點(diǎn)7.5 TFLOPS。
基于此前的NVIDIA NVLink架構(gòu),英偉達(dá)還推出了全新的NVSwitch架構(gòu)。這一互聯(lián)架構(gòu)的帶寬比PCle交換機(jī)高5倍,足以支持更大規(guī)模和復(fù)雜的數(shù)據(jù)集運(yùn)算,讓開(kāi)發(fā)者和科學(xué)家可以構(gòu)建更高級(jí)的系統(tǒng)。
基于Tesla V100的升級(jí)和全新的NVSwitch架構(gòu),英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。
在2016年的GTC上英偉達(dá)正式發(fā)布DGX 1,它擁有8顆帕斯卡架構(gòu)GP100核心的Tesla P100 GPU,以及7TB的SSD,由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內(nèi)存驅(qū)動(dòng)。售價(jià)為129000美元。2017年9月份,英偉達(dá)推出了一款基于Volta架構(gòu)的DGX 1V,擁有8塊Tesla V100。
而DGX 2應(yīng)用了最新的NVSwitch架構(gòu),通過(guò)12個(gè)NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間,總計(jì)512 GB HBM2存儲(chǔ),能實(shí)現(xiàn)每秒高達(dá)2千萬(wàn)次的浮點(diǎn)運(yùn)算。此外,基于NVSwitch架構(gòu)的應(yīng)用,16塊GPU可以實(shí)現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。
DGX 2內(nèi)含16顆Tesla V100芯片
“這是全球最大的GPU。”黃仁勛表示,他還用“美麗、性感”等詞語(yǔ)來(lái)形容這一款最新的DGX系列產(chǎn)品。
DGX 2的售價(jià),黃仁勛首先給出的是150萬(wàn)美元,最后直接減價(jià)為39.9萬(wàn)美元,將在今年的第三季度正式開(kāi)放購(gòu)買(mǎi)。
面向藝術(shù)及設(shè)計(jì)領(lǐng)域,英偉達(dá)還推出了搭載了NVIDIA RTX(實(shí)時(shí)光線追蹤)技術(shù)的NVIDIA Quadro GV100 GPU。單塊GPU擁有32GB內(nèi)存,可以基于NVLink技術(shù)將兩塊GV100 GPU并聯(lián),從而將內(nèi)存提升至64GB。在前一周的游戲開(kāi)發(fā)者大會(huì)上,英偉達(dá)正式推出了NVIDIA RTX技術(shù)。
GV100 GPU基于最新的Volta架構(gòu),可以提供每秒7.4萬(wàn)億次浮點(diǎn)運(yùn)算的雙精度性能,每秒14.8萬(wàn)億次浮點(diǎn)運(yùn)算的單精度性能,以及每秒118.5萬(wàn)億次浮點(diǎn)運(yùn)算的深度學(xué)習(xí)性能。
黃仁勛手中的GV100 GPU
這款產(chǎn)品主要針對(duì)傳媒娛樂(lè)從業(yè)者、產(chǎn)品設(shè)計(jì)師、建筑設(shè)計(jì)師等專(zhuān)業(yè)設(shè)計(jì)與流媒體專(zhuān)業(yè)人員。其中,NVIDIA RTX內(nèi)置的NVIDIA OpitX AI-denoiser可以實(shí)現(xiàn)實(shí)時(shí)的AI降噪去噪。
硬件之外,英偉達(dá)還發(fā)布了針對(duì)軟件的更新——TensorRT 4軟件。這一軟件可用于優(yōu)化、驗(yàn)證和部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車(chē)GPU平臺(tái)中經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
為了籠絡(luò)更多的開(kāi)發(fā)者,英偉達(dá)與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中。
自動(dòng)駕駛—暫停自動(dòng)駕駛研發(fā)
自動(dòng)駕駛?cè)栽诒敬蜧TC的討論之列
英偉達(dá)的自動(dòng)駕駛平臺(tái)可以統(tǒng)稱(chēng)為Drive PX系列。但是其實(shí),Drive PX只是NVIDIA車(chē)載AI平臺(tái)的系列名稱(chēng)。而這個(gè)系列目前主要包括兩代產(chǎn)品:已經(jīng)量產(chǎn)的Drive PX 2平臺(tái),以及在2018年初展示的新一代平臺(tái)Xavier。
不過(guò)黃仁勛卻在GTC 2018上宣布英偉達(dá)將暫停自動(dòng)駕駛的研發(fā)工作,雖然沒(méi)有說(shuō)明何時(shí)能再推進(jìn)這一進(jìn)程,但是他也表示“不會(huì)太久。”
在2018年2月9日對(duì)外發(fā)布的2018財(cái)年第四季度及全年財(cái)報(bào)中,英偉達(dá)曾經(jīng)提到過(guò)與Uber、Aurora合作打造自動(dòng)駕駛汽車(chē),采用的就是開(kāi)源的NVIDIA Drive人工智能自動(dòng)駕駛平臺(tái)。
美國(guó)當(dāng)?shù)貢r(shí)間3月18日晚上,亞利桑那州一名女子被Uber自動(dòng)駕駛汽車(chē)撞傷,之后不幸身亡。這是全球首例自動(dòng)駕駛車(chē)輛致人死亡的事故,隨后Uber宣布將暫停其在美國(guó)和加拿大的自動(dòng)駕駛項(xiàng)目。隨后在26日,亞利桑那州州長(zhǎng)宣布暫禁Uber在亞利桑那州公路測(cè)試自駕車(chē)。
黃仁勛在回答媒體關(guān)于該案件的提問(wèn)時(shí)表示,英偉達(dá)對(duì)于這個(gè)意外感到悲傷,但是自動(dòng)駕駛的研究本身是沒(méi)有錯(cuò)的,應(yīng)該從這個(gè)案件中吸取經(jīng)驗(yàn),提升自動(dòng)駕駛的安全性。作為Uber在自動(dòng)駕駛領(lǐng)域的合作方之一,英偉達(dá)暫停自動(dòng)駕駛的研發(fā)可能和Uber的自動(dòng)駕駛汽車(chē)撞人致死案有關(guān),但其并沒(méi)有完全放棄自動(dòng)駕駛項(xiàng)目。
英偉達(dá)的DRIVE Constellation仿真系統(tǒng)
英偉達(dá)在GTC上推出了針對(duì)自動(dòng)駕駛汽車(chē)測(cè)試的仿真系統(tǒng)——DRIVE Constellation。
DRIVE Constellation仿真系統(tǒng)是一套使用照片級(jí)真實(shí)感模擬,基于云的自動(dòng)駕駛汽車(chē)測(cè)試系統(tǒng)。它基于兩個(gè)不同的服務(wù)器,第一臺(tái)服務(wù)器運(yùn)行的是DRIVE Sim軟件,可以模擬自動(dòng)駕駛汽車(chē)的傳感器,比如攝像頭、激光雷達(dá)和雷達(dá)等。
DRIVE Sim軟件可以通過(guò)生成照片級(jí)的數(shù)據(jù)流,從而創(chuàng)建不同的測(cè)試環(huán)境,比如晴天、暴雨、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況、急轉(zhuǎn)彎或陡坡等不同的路面狀況。并且在模擬過(guò)程中設(shè)置各種危險(xiǎn)和突發(fā)狀況,比如行人突然穿越馬路等,以測(cè)試自動(dòng)駕駛汽車(chē)的反應(yīng)能力,以確定其不會(huì)對(duì)人帶來(lái)安全威脅。
第二臺(tái)服務(wù)器搭載的是NVIDIA DRIVE Pegasus AI汽車(chē)計(jì)算平臺(tái),運(yùn)行完整的自動(dòng)駕駛汽車(chē)軟件堆棧,并能夠處理傳感器搜集模擬數(shù)據(jù)。經(jīng)過(guò)處理的數(shù)據(jù)會(huì)被反饋給傳感器,一直進(jìn)行數(shù)據(jù)的循環(huán)。
從時(shí)間來(lái)看,英偉達(dá)推出的這個(gè)仿真系統(tǒng)和Uber的自動(dòng)駕駛汽車(chē)撞人致死案并無(wú)太大關(guān)聯(lián),不過(guò)在長(zhǎng)遠(yuǎn)的未來(lái),它將能有效幫助提升自動(dòng)駕駛汽車(chē)測(cè)試的安全性。
英偉達(dá)還宣布與ARM達(dá)成了合作,共同為全球數(shù)十億臺(tái)IoT設(shè)備提供深度學(xué)習(xí)的能力。雙方將開(kāi)源的英偉達(dá)深度學(xué)習(xí)加速器整合到ARM的Project Trillium機(jī)器學(xué)習(xí)平臺(tái)上。
2018年2月23日,ARM推出了Project Trillium項(xiàng)目,這是一套包括新的高度可擴(kuò)展處理器的ARM IP組合,這些產(chǎn)品可以提供增強(qiáng)的機(jī)器學(xué)習(xí)(ML)和神經(jīng)網(wǎng)絡(luò)(NN)功能。當(dāng)前的技術(shù)產(chǎn)品主要針對(duì)移動(dòng)設(shè)備市場(chǎng),將讓全新的搭載機(jī)器學(xué)習(xí)功能的設(shè)備具有先進(jìn)的計(jì)算能力,包括先進(jìn)的目標(biāo)檢測(cè)功能。
在將英偉達(dá)深度學(xué)習(xí)加速器整合到Project Trillium之后,全球數(shù)十億臺(tái)的消費(fèi)電子設(shè)備上的IoT芯片將具備機(jī)器學(xué)習(xí)能力。
GTC之外—計(jì)算力提升從創(chuàng)新驅(qū)動(dòng)變?yōu)樾枨篁?qū)動(dòng)
提到英偉達(dá)和黃仁勛,就不得不提到CPU。在2017年的GTC上,黃仁勛曾聲稱(chēng)摩爾定律已經(jīng)終結(jié),設(shè)計(jì)人員無(wú)法再創(chuàng)造出可以實(shí)現(xiàn)更高指令集并行的GPU架構(gòu),晶體管數(shù)量每年增長(zhǎng)50%,但CPU的性能每年僅增長(zhǎng)10%。
在演講中,黃仁勛沒(méi)有放過(guò)任何一次揶揄CPU的機(jī)會(huì)。不管是更新后的Tesla V100、DGX 2,還是最新發(fā)布的GV100 GPU,黃仁勛聲稱(chēng)“在提供相同的計(jì)算力下,它們都比CPU組成的集群要更節(jié)能、高效,占用更少的空間。”
“買(mǎi)得越多,省得越多。”已經(jīng)成了他的口頭禪。然而回歸到英偉達(dá)本身,其本身的高速增長(zhǎng)很大一部分是依賴(lài)于市場(chǎng)對(duì)圖形芯片的巨大需求。
在英偉達(dá)公布的2018財(cái)年第四季度財(cái)報(bào)中,雖然數(shù)據(jù)中心業(yè)務(wù)同比實(shí)現(xiàn)了一倍多的增長(zhǎng)達(dá)到6.06億美元。但游戲圖形芯片業(yè)務(wù)的營(yíng)收達(dá)17.4億美元,同比增長(zhǎng)29%,占該季度總營(yíng)收的一半以上。
“加密貨幣市場(chǎng)的強(qiáng)勁需求超出了我們的預(yù)期。” 英偉達(dá)首席財(cái)務(wù)官科萊特·克雷斯表示,“盡管加密貨幣對(duì)我們業(yè)務(wù)的總體貢獻(xiàn)仍難以量化,但我們認(rèn)為,其在營(yíng)收中所比例高于上一季度。”
從產(chǎn)品本身來(lái)說(shuō), GPU目前只能是不斷疊加性能,帶來(lái)的驚喜越來(lái)越少。以DGX系列為例,內(nèi)含的GPU芯片從4顆變成了8顆,今年從8顆增長(zhǎng)到了16顆,改變的只不過(guò)是互聯(lián)的架構(gòu)。單顆芯片的算力提升越來(lái)越難,英偉達(dá)的“橫向發(fā)展”只是另辟蹊徑。
不過(guò),英特爾的Nervana芯片,谷歌的TPU(目前只在谷歌內(nèi)部使用)對(duì)于英偉達(dá)來(lái)說(shuō)是潛在的競(jìng)爭(zhēng)對(duì)手。有競(jìng)爭(zhēng)在,更大的驚喜才有可能會(huì)到來(lái)。
未來(lái)智能實(shí)驗(yàn)室是人工智能學(xué)家與科學(xué)院相關(guān)機(jī)構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機(jī)構(gòu)。
未來(lái)智能實(shí)驗(yàn)室的主要工作包括:建立AI智能系統(tǒng)智商評(píng)測(cè)體系,開(kāi)展世界人工智能智商評(píng)測(cè);開(kāi)展互聯(lián)網(wǎng)(城市)云腦研究計(jì)劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106437 -
gpu
+關(guān)注
關(guān)注
28文章
4948瀏覽量
131271 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249614
原文標(biāo)題:Nvidia黃仁勛發(fā)布了全球最大GPU
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)
NVIDIA GPU助力科研人員探索外星世界
0xmd公司通過(guò)NVIDIA GPU打造醫(yī)療AI解決方案
NVIDIA在CES 2025展示全新產(chǎn)品
NVIDIA推出GeForce RTX 50系列臺(tái)式機(jī)和筆記本電腦GPU
NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布
NVIDIA和GeForce RTX GPU專(zhuān)為AI時(shí)代打造
借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率
《CST Studio Suite 2024 GPU加速計(jì)算指南》
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

AMD與NVIDIA GPU優(yōu)缺點(diǎn)

新款Nvidia Titan GPU正在開(kāi)發(fā)中?或?qū)魯∥?b class='flag-5'>發(fā)布的RTX 5090

NVIDIA全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊

評(píng)論