3月27日美國圣何塞報道,今天早上,英偉達GTC 2018年度大會的最重磅環(huán)節(jié)——創(chuàng)始人&CEO黃仁勛主題演講——正式開始。
每年的GTC大會上,這位被粉絲們愛稱為“老黃”的黑色皮衣愛好者CEO都會帶來一場重磅主題演講,通常來說不僅會發(fā)布新型GPU與超算電腦,還會宣布一些AI/VR/自動駕駛等領(lǐng)域重磅合作。
不過,今年的GTC 2018比較神奇,最為重磅的消息選擇了在提前秘密發(fā)布,而不是在GTC Keynote現(xiàn)場——英偉達重磅宣布,將聯(lián)合芯片巨頭ARM打造IOT設(shè)備的AI芯片專用IP,這款機器學(xué)習(xí)IP集成到Arm的Project Trillium平臺上,以實現(xiàn)機器學(xué)習(xí),其技術(shù)源于英偉達Xavier芯片以及去年開源的DLA深度學(xué)習(xí)加速器項目。
ARM是全球智能設(shè)備第一大主流芯片架構(gòu)提供商,全球超過90%的智能設(shè)備采用了ARM的芯片架構(gòu),包括手機、平板、手表、電視、無人機等等。本次ARM牽手英偉達推出專用的IOT設(shè)備人工智能IP,將會有助于人工智能在終端設(shè)備廣泛鋪開,使得上億、甚至數(shù)十億臺IOT設(shè)備都能夠用上低功耗、低成本的AI芯片,使物聯(lián)網(wǎng)芯片公司能夠輕松地將AI集成到它們的設(shè)計中,并幫助它們將智能且價格實惠的產(chǎn)品帶給全球數(shù)十億的消費者。
NVIDIA副總裁兼自主機器事業(yè)部總經(jīng)理Deepu Talla表示:“推理將成為每個物聯(lián)網(wǎng)設(shè)備的核心能力。我們將與ARM一同推進這一趨勢的發(fā)展,幫助數(shù)百家芯片公司輕松采用深度學(xué)習(xí)技術(shù)。”
此外,在今天的GTC 2018上,黃仁勛還宣布了英偉達的以下進展:
1、推出光線追蹤RTX技術(shù)(ray-tracing),能夠提供電影級畫質(zhì)的實時渲染,渲染出逼真的反射、折射和陰影畫面。這一技術(shù)由英偉達在前不久的GDC全球游戲開發(fā)者大會上展示過;
2、推出第一款采用Volta架構(gòu)的Quadro GV100 GPU,由兩個GV100連接而成;
3、推出了第一款專用于醫(yī)療圖像處理的超級電腦Clara;
4、新版Tesla V100內(nèi)存升為32G,可與舊版無縫換插,支持更多人工智能的工作負(fù)載;
5、推出DGX-2超級電腦,采用了最新的NVSwitch鏈接,最多可同時連接16塊Tesla V100 GPU,其速度可以達到DGX-1的10倍,算下來可以每秒下載14000 部電影,售價39.9萬美元;
6、推出新版機器學(xué)習(xí)應(yīng)用平臺TensorRT 4,支持INT8與FP16精度,并與谷歌合作,將其整合進AI開源框架谷歌TensorFlow 1.7中;
7、宣布打造下一代名為DRIVE Orin的自動駕駛芯片,但除了名字外沒有透露更多信息;
8、正式推出3D仿真自動駕駛測試平臺DRIVE Constellation,這一測試平臺英偉達在CES上展示過,能夠幫助自動駕駛系統(tǒng)提升“姿勢水平”;
9、推出ISAAC機器人仿真訓(xùn)練平臺SDK,將訓(xùn)練機器人的技術(shù)開放出去;
值得一提的是,智東西去年5月時也對GTC 2017進行了一線深入報道,在去年的CEO主題演講開場前,英偉達的股價一路飆升至121美元,總市值達到了714億美元。而在今年開場前一晚,英偉達的股價已經(jīng)沖到了244美元,總市值超過1479億美元。在這10個月內(nèi),英偉達的股價與市值再次翻倍。
光線追蹤(ray-tracing)技術(shù)開場
今天一大早,智東西來到了GTC大會現(xiàn)場,準(zhǔn)備參加每年GTC的最重磅環(huán)節(jié)——CEO黃仁勛主題演講。此時是早上8點,離9點開場還有整整一小時前,但是入口處已經(jīng)排起了巨長的隊伍。
今天,老黃依舊是萬年不變的一身黑皮衣+黑褲子開場。
他開場介紹的第一個項目就是英偉達在前不久GDC上發(fā)布的NVIDIA RTX光線追蹤技術(shù)(ray-tracing),這項技術(shù)是英偉達耗時10年打造的,能夠提供電影級畫質(zhì)的實時渲染,渲染出逼真的反射、折射和陰影畫面,幾乎與真實世界的照片或視頻很難區(qū)分開來。現(xiàn)場展示的視頻片段就是用光線追蹤技術(shù)實時渲染的,而且并不需要一個超級強大的超算電腦,只需要一臺DGX-Station。
在真實世界中,我們看到的3D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術(shù)則是反過來,通過從我們的眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,并應(yīng)用到場景的3D模型中。
可想而知,這種技術(shù)的計算量非常大,一般渲染復(fù)雜的特殊效果可能需要花上幾天甚至幾周的時間,所以此前該項技術(shù)一直僅限于高成本的電影制作中。
不過,目前,隨著GPU性能日益強悍,能夠支持光線追蹤的電腦也越來越多,通過Volta架構(gòu)的GPU配合英偉達的RTX技術(shù),產(chǎn)品設(shè)計師、游戲設(shè)計師、建筑師們能夠在幾秒內(nèi)即可生成逼真的產(chǎn)品模型。
此外,英偉達還宣布GameWorks SDK 將添加一個光線追蹤降噪模塊。更新版 GameWorks SDK 即將推出,其中包含光線追蹤區(qū)域陰影和光線追蹤光澤反射。
新版Quadro GV100,首次采用Volta架構(gòu)
與此同時,英偉達還在現(xiàn)場推出了Quadro GV100 GPU,同時也是同系列產(chǎn)品中第一個采用Volta架構(gòu)的,因此能夠搭載RTX技術(shù)的。
Quadro GV100由兩個GV100連接而成,一共擁有10240個CUDA核,可達236 TFLOPS Tensor Cores。與此同時,老黃又玩起了“買GPU省錢”的梗——“你買的GPU越多,就越省錢(The more you buy, the more you save.)”,這一個梗再次貫穿了全場。
推出醫(yī)療專用超級電腦Clara,日常diss摩爾定律
接著,話鋒一轉(zhuǎn),老黃開始談起了計算力,我們也進入了GTC的必備環(huán)節(jié)——diss摩爾定律。
在將近10年的GTC上,每年老黃都會提到同一主題——摩爾定律。在過去30年里,我們受益于摩爾定律,芯片所提供的計算能力每年都高速增長。然而在最近的幾年里,摩爾定律開始失靈,芯片發(fā)展的速度已經(jīng)跟不上我們需要的計算力增長速度。
因此,我們需要新定律。
而隨著數(shù)據(jù)量與計算量爆發(fā)式地增長,人工智能、GPU、CUDA正在以一種極快的速度崛起,以GPU驅(qū)動的人工智能計算已經(jīng)隨處可見,并且滲入到各行各業(yè)當(dāng)中去,教育、娛樂、工業(yè)、制造……這也引出了我們下一個話題——醫(yī)療。
老黃在現(xiàn)場推出了第一款專用于醫(yī)療圖像處理的超級電腦Clara,它能夠支持CUDA、CUDNN、TensorRT、OGL、以及剛剛提到的RTX技術(shù)。
在現(xiàn)場,老黃展示了一個醫(yī)療圖像實時處理的影像片段。這個段影像是用十幾年的超聲波老設(shè)備拍攝而成,本來只能看到2D的黑白圖像。然而當(dāng)數(shù)據(jù)傳進Clara后,配合人工智能軟件,可以在2D圖像中分析出3D的腔膛形狀(圖中紅色部分)。因此,醫(yī)院可以在現(xiàn)有醫(yī)療設(shè)備上直接接入這臺電腦。
目前,英偉達正在和眾多醫(yī)療廠商合作,除了GE通用電氣、三星電子等大廠外,還有像圖瑪深維、推想科技等AI醫(yī)療創(chuàng)業(yè)公司。
新品升級:新版Tesla V100、DGX-2超級電腦、TensorRT 4
在去年的GTC 2017上,老黃發(fā)布了一款名為Tesla V100的新版GPU,使用Volta架構(gòu),采用的是臺積電的12nm Finfet工藝,具有5120個CUDA處理內(nèi)核,16GB內(nèi)存,能夠為訓(xùn)練、推理應(yīng)用提供120 tensor TFLOPS算力。
今天,老黃宣布,新版Tesla V100將內(nèi)存升級一倍,達到32GB。
由于這幾年間,CNN、RNN、GANs、Deep Q-Learning等算法不斷變得復(fù)雜,更是對深度學(xué)習(xí)計算硬件提出了新挑戰(zhàn)。因此,新版Tesla V100擁有更大的內(nèi)存,使得它能夠運行更大、更復(fù)雜的神經(jīng)網(wǎng)絡(luò),在某些HPC應(yīng)用上能夠提供高于之前16GB版本50%的性能。微軟已經(jīng)宣布采用了新版Tesla V100,能夠更快速地訓(xùn)練更加強大的深度神經(jīng)網(wǎng)絡(luò)。
此外,英偉達本次還推出的NVSwitch高速互聯(lián)技術(shù)。此前英偉達曾經(jīng)推出NVLink,支持最多8塊GPU高速互聯(lián);如今NVSwitch技術(shù)可將這個數(shù)字翻上一倍,支持最多16塊GPU同時互聯(lián)。每一個GPU都能和另一個GPU進行超低延遲的通訊。
在去年GTC上,英偉達推出了搭載8塊Tesla V100的超級電腦DGX-1,今天在GTC 2018現(xiàn)場老黃宣布,推出能夠搭載16塊新版Tesla V100的超級電腦DGX-2,比DGX-1還要快10倍。
DGX-2能夠進行2 PFLOPS的計算,算下來可以每秒下載14000部電影,擁有512GB HBM2,功耗為10kw,350lbs,能夠支持更大數(shù)據(jù)集、更復(fù)雜神經(jīng)網(wǎng)絡(luò)的計算。售價399000美元,今年Q3上市。
它其中搭載著被老黃稱為“世界上最大的GPU”,共有81920個CUDA核,可達2000 TFLOPS Tensor Cores,擁有512GB HBM2。
此外,去年的GTC上,英偉達推出了“英偉達GPU云(NVIDIA GPU Cloud)”,但它不是一個云計算“云”,而是一個能讓人輕易地從零開始搭建一個深度學(xué)習(xí)的項目。今天老黃宣布,AWS、阿里云、DGX、GCP、Oracle Cloud上都開始支持英偉達GPU云了。
而且,從CNN到LSTM再到GANs,現(xiàn)在的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)框架正變得越來越復(fù)雜、越來越多樣、而且在日新月異地變化著,訓(xùn)練環(huán)節(jié)變得復(fù)雜了,應(yīng)用(Inference)環(huán)節(jié)自然也變得非常復(fù)雜。
因此,老黃還在現(xiàn)場推出了最新版本的TensorRT——TensorRT 4,這是一款可編程應(yīng)用平臺(Programmable Inference Platform),當(dāng)你將一個神經(jīng)網(wǎng)絡(luò)訓(xùn)練好了之后,可以通過TensorRT可編程平臺,簡便快捷地將這個訓(xùn)練好了的神經(jīng)網(wǎng)絡(luò)部署(Deploy)到英偉達的GPU上。
新版TensorRT 4能夠支持INT8和FP16精度運算,能夠?qū)?shù)據(jù)中心的功耗降低70%。而且,英偉達還與谷歌進行了深度合作,將TensorRT整合進如今最廣泛應(yīng)用的AI開源框架谷歌TensorFlow 1.7中。而且現(xiàn)在還能夠加速圖像、視頻、語言、NLP等AI應(yīng)用。
同時,老黃還在現(xiàn)場宣布,KUBERNETES現(xiàn)在能夠支持GPU了。KUBERNETES能夠在主機集群之間提供一個能夠自動化部署、可拓展、應(yīng)用容器可運營的平臺,通常結(jié)合docker容器工具工作,并且整合多個運行著docker容器的主機集群,不僅能夠提供更大的計算力,還能夠有更大的容錯空間。
打造下一代DRIVE Orin自動駕駛芯片
老黃在現(xiàn)場還展示了英偉達感知基礎(chǔ)(Perception Infrastructure)項目,這是一個大型的深度學(xué)習(xí)模型,能夠收集并分析不同傳感器(如攝像機、雷達等等)得出的距離、天氣、雷達感知、高精地圖等等不同數(shù)據(jù)。
在接下來2-3年間,英偉達還將技術(shù)研發(fā)這一技術(shù),直到最后能夠搭載在所有新車上。老黃說,這是我們至今遇到的最為復(fù)雜的問題之一。
在現(xiàn)場,老黃還展示了英偉達DRIVE的研發(fā)路徑,它們都基于同一框架、滿足ADSL-D的安全標(biāo)準(zhǔn)、并且性能/功耗比非常高:從DRIVE PX Parker、到DRIVE PX 2、再到DRIVE Xavier、再到DRIVE Pegasus……
老黃說,雖然DRIVE Pegasus已經(jīng)非常強大了,但是,英偉達還會打造下一代名為DRIVE Orin的芯片,不過現(xiàn)場沒有透露更多信息。
推出自動駕駛仿真測試平臺DRIVE Constellation
在今年1月的CES上,老黃曾經(jīng)展示了一個全新的3D自動駕駛仿真測試平臺。而今天,老黃正式推出了這款名為DRIVE SIM and Constellation的3D自動駕駛仿真測試平臺。
這款平臺包括兩個部分,先是在云端模擬照片級真實的圖像,生成傳感器數(shù)據(jù)(包括攝像頭、雷達等)第二部分則包括將這些數(shù)據(jù)傳到英偉達DRIVE Pegasus中,并運行全套自動駕駛軟件,以幫助訓(xùn)練該自動駕駛系統(tǒng)提升“姿勢水平”。
在實際演示中,英偉達的新仿真平臺顯得十分強大,不僅有傳統(tǒng)一點的實時車導(dǎo)線規(guī)劃、其他車輛識別,而且對環(huán)境的還原相當(dāng)真實,復(fù)雜的光線條件也能夠被模擬。測試人員還能夠在平臺內(nèi)操縱、變化車輛傳感器的探測范圍。
另外,這個平臺還支持開發(fā)人員在虛擬環(huán)境中“人為駕駛”一輛車作出各種危險動作來考驗測試車,來考驗測試車的算法。
會上,老黃還宣布,目前英偉達自動駕駛合作伙伴的數(shù)量已經(jīng)達到了370家,其中包括整車廠、一級供應(yīng)商、以及200+家創(chuàng)企。
與自動駕駛仿真測試平臺相似的,英偉達還在去年推出了專用于機器人的仿真測試平臺——ISAAC機器人訓(xùn)練模擬世界。你可以用這個虛擬世界來訓(xùn)練機器人前進、后退、轉(zhuǎn)彎、躲避行人等。
今天,老黃宣布將ISAAC平臺的技術(shù)開放出去,推出ISAAC SDK。
此外,英偉達此前還推出過一款VR多人交互平臺Holodeck。在今天的GTC 2018上,英偉達還展示了一個非常有趣、也非常’黑科技“的DEMO:在Holodeck虛擬世界里遠程控制現(xiàn)實世界里的汽車。(看過《黑豹》的同學(xué)大概可以理解一下)
上文提到,今年的GTC 2018比較神奇,最為重磅的消息選擇了在提前秘密發(fā)布,而不是在GTC Keynote現(xiàn)場——英偉達重磅宣布,將聯(lián)合芯片巨頭ARM打造AI芯片專用IP,這款I(lǐng)P屬于ARM幾年2月公布的Trillium項目的一部分,其技術(shù)源于英偉達Xavier芯片以及去年開源的DLA深度學(xué)習(xí)加速器項目。
英偉達本次宣布同AEM合作,將在數(shù)十億物聯(lián)網(wǎng)設(shè)備上實現(xiàn)深度學(xué)習(xí)。NVIDIA深度學(xué)習(xí)加速器IP將集成到Arm的Project Trillium平臺中,以便于構(gòu)建深度學(xué)習(xí)IoT芯片。
去年,英偉達也正式免費開源了完整版DLA(Deep Learning Accelerator,深度學(xué)習(xí)加速器),讓廠商可以免費下載使用,打造屬于自己的低功耗AI芯片(比如IoT芯片)。
今年2月,芯片巨頭ARM公布了其人工智能項目Trillium,同時推出兩款專用IP,分別為物體檢測OD處理器和機器學(xué)習(xí)ML處理器。
ARM是全球智能設(shè)備第一大主流芯片架構(gòu)提供商,全球超過90%的智能設(shè)備采用了ARM的芯片架構(gòu),包括手機、平板、手表、電視、無人機等等。而英偉達,作為全球AI浪潮的引領(lǐng)者,能夠為人工智能提供強大的計算力,二者一拍即合。
本次ARM牽手英偉達推出專用的IOT設(shè)備人工智能IP,將會有助于人工智能在終端設(shè)備廣泛鋪開,使得上億、甚至數(shù)十億臺IOT設(shè)備都能夠用上低功耗、低成本的AI芯片,使物聯(lián)網(wǎng)芯片公司能夠輕松地將AI集成到它們的設(shè)計中,并幫助它們將智能且價格實惠的產(chǎn)品帶給全球數(shù)十億的消費者。
NVIDIA副總裁兼自主機器事業(yè)部總經(jīng)理Deepu Talla表示:“推理將成為每個物聯(lián)網(wǎng)設(shè)備的核心能力。我們將與ARM一同推進這一趨勢的發(fā)展,幫助數(shù)百家芯片公司輕松采用深度學(xué)習(xí)技術(shù)。”
結(jié)語:更多精彩敬請期待
今年,共有超過8000人來到了GTC 2018現(xiàn)場,150個展位。值得一提的是,英偉達也在推動女性在科技行業(yè)中的力量,今年女性占據(jù)了GTC 2018總開發(fā)者的8%,總參會者的10%,以及11%的演講者。
每年的GTC上,除了英偉達的各類主業(yè)務(wù)負(fù)責(zé)人的交流溝通會議、來自大大小小各類開發(fā)者或技術(shù)大牛的主題演講外、還有150家英偉達的合作企業(yè)布設(shè)展位,以供開發(fā)者與媒體參觀交流。
-
ARM
+關(guān)注
關(guān)注
134文章
9193瀏覽量
370205 -
人工智能
+關(guān)注
關(guān)注
1799文章
47966瀏覽量
241312 -
英偉達
+關(guān)注
關(guān)注
22文章
3862瀏覽量
92275
原文標(biāo)題:英偉達GTC 2018最全記錄,十大亮點都在這里!
文章出處:【微信號:Anxin-360ic,微信公眾號:芯師爺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論