NVIDIA發(fā)布重磅最新軟件應(yīng)用、硬件系統(tǒng)以及與寶馬集團合作
NVIDIA提出了下一代計算的愿景,該愿景將全球信息經(jīng)濟的重心從服務(wù)器轉(zhuǎn)移到了新型的強大且靈活的數(shù)據(jù)中心。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在其加州住宅的廚房中錄制的六集同時發(fā)布的主題演講中,介紹了NVIDIA最近對Mellanox的收購,還有重盼所歸的基于NVIDIA Ampere GPU架構(gòu)的新產(chǎn)品以及重要的最新軟件技術(shù)。
這場主題演講原計劃于3月底在圣何塞舉行的NVIDIA GPU技術(shù)大會上現(xiàn)場直播,但因冠狀病毒疫情而受到影響。
“我要感謝正前線抗擊COVID-19所有勇敢的戰(zhàn)士們。”黃仁勛在開場時說到,“NVIDIA正在與研究人員和科學家合作,使用GPU和AI計算來治療、緩解、控制和追蹤這種大規(guī)模傳染性疾病。”
NVIDIA也宣布了其NVIDIA Clara醫(yī)療平臺的更新,旨在對抗COVID-19新型冠狀病毒。
“研究人員和科學家們正在使用NVIDIA加速計算來挽救生命——這完美地詮釋了我們公司的宗旨:通過制造計算機,解決普通計算機不能解決的問題。”黃仁勛說。
演講主要圍繞作為現(xiàn)代全球信息經(jīng)濟機房的數(shù)據(jù)中心如何變化,以及在上月完成交易的收購案雙方NVIDIA和Mellanox如何共同推動這些變化的愿景。
“數(shù)據(jù)中心是新的計算單元,NVIDIA正在加速從芯片到CPU和GPU的連接方式,再到整個軟件堆棧,以及最終跨整個數(shù)據(jù)中心的性能提升。”
數(shù)據(jù)中心規(guī)模計算的系統(tǒng)優(yōu)化
首先,NVIDIA為這種新型的數(shù)據(jù)中心規(guī)模計算優(yōu)化了新的GPU架構(gòu),集AI訓練和推理于一身,并實現(xiàn)了靈活且彈性的加速。
NVIDIA A100是第一個基于NVIDIA Ampere架構(gòu)的GPU,提供了在NVIDIA八代GPU里最大的性能提升,它還可用于數(shù)據(jù)分析,科學計算和云圖形,并已全面投產(chǎn)并交付給全球客戶。
全球18家領(lǐng)先的服務(wù)提供商和系統(tǒng)構(gòu)建商正在將NVIDIA A100整合到他們的服務(wù)和產(chǎn)品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。
相比上一代,NVIDIA Ampere架構(gòu)的A100將性能提升了20倍。A100的五大關(guān)鍵特性包括:
帶有TF32的第三代Tensor Core核心,這是一種新的數(shù)值格式,可加速開箱即用的單精度AI訓練。NVIDIA廣泛使用的Tensor Core現(xiàn)在更加靈活,快速,且更易于使用
結(jié)構(gòu)稀疏性(Structural sparsity)加速,這是一種新的高效技術(shù),可以利用AI數(shù)學固有的稀疏性來獲得更高的性能
多實例GPU(Multi-instance GPU或MIG),允許將一個A100分割為多達七個獨立的GPU,每個GPU都有自己的資源
第三代NVLink技術(shù),使GPU之間的高速聯(lián)接能力加倍,從而可以使多個A100服務(wù)器充當一個巨型GPU
以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構(gòu)相比,訓練性能提高了6倍,推理性能提高了7倍。
NVIDIA DGX A100具備5 Petaflops的性能
NVIDIA還將發(fā)售第三代NVIDIA DGX AI系統(tǒng)—基于NVIDIA A100的NVIDIA DGX A100—世界上第一臺5 petaflops服務(wù)器。每臺DGX A100可以分割為多達56個獨立運行的實例。
這使得單個服務(wù)器可以“縱向擴展”以完成諸如AI訓練之類的計算密集型任務(wù),或者“橫向擴展”以進行AI部署或推理。
該系統(tǒng)的最初使用者是美國能源部的阿貢國家實驗室,該實驗室將利用該集群的AI和計算能力更好地理解和對抗COVID-19。此外,還有佛羅里達大學和德國人工智能研究中心。
美國能源部阿貢國家實驗室,將使用DGX A100賦能的AI和算力更好地了解并抗擊COVID-19
A100也將作為HGX A100提供給云合作伙伴和服務(wù)器制造商。
一套由五臺DGX A100系統(tǒng)提供動力的數(shù)據(jù)中心,其成本僅為100萬美元,功耗僅為28千瓦,但其性能足以媲美一套典型數(shù)據(jù)中心(由50臺用于AI訓練的DGX-1系統(tǒng)和600個總功耗高達630千瓦的CPU系統(tǒng)構(gòu)成,成本超過1100萬美元)。
NVIDIA還宣布了下一代DGX SuperPOD。它由140臺DGX A100系統(tǒng)和Mellanox網(wǎng)絡(luò)技術(shù)搭建而成,可提供700 petaflops的AI性能,堪比全球20臺最快的計算機中的任何一臺。
新一代DGX SuperPOD實現(xiàn)了強達每秒70 petaflops的AI算力
NVIDIA正在用四個DGX SuperPOD來擴展自己的數(shù)據(jù)中心,為其內(nèi)部超級計算機SATURNV,增加了2.8 exaflops的AI計算能力(總計4.6 exaflops),使其成為世界上最快的AI超級計算機。
NVIDIA同時也發(fā)布了NVIDIA EGX A100,將強大的實時云計算功能帶到了邊緣。其NVIDIA Ampere架構(gòu)GPU提供了第三代Tensor Core和新的安全功能。得益于其NVIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯(lián)網(wǎng)功能。
當今世界上最重要的應(yīng)用軟件
NVIDIA GPU將為主要軟件應(yīng)用程序提供動力,以加速三個關(guān)鍵用途:管理大數(shù)據(jù),創(chuàng)建推薦系統(tǒng)和構(gòu)建實時會話式AI。
隨著機器學習的有效性推動公司收集了越來越多的數(shù)據(jù),這些新工具應(yīng)運而生。積極的反饋使我們體驗到的數(shù)據(jù)收集量呈指數(shù)級增長。
為了幫助各類組織順應(yīng)潮流,NVIDIA宣布在Spark 3.0上支持NVIDIA GPU加速,大數(shù)據(jù)分析將成為當今世界上最重要的應(yīng)用程序之一。
基于RAPIDS的Spark 3.0,打破了提取,轉(zhuǎn)換和加載數(shù)據(jù)的性能基準。它已經(jīng)幫助Adobe Intelligent Services將計算成本降低了90%。
關(guān)鍵的云分析平臺(包括Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI和Google Cloud Dataproc)都將借助NVIDIA加速。
黃仁勛還宣布推出了NVIDIA Merlin,這是一個用于構(gòu)建下一代推薦系統(tǒng)的端到端框架,該系統(tǒng)正迅速成為更加個性化互聯(lián)網(wǎng)的引擎。Merlin將創(chuàng)建一個100 TB數(shù)據(jù)集推薦系統(tǒng)所需的時間從四天減少到20分鐘。
他還詳細介紹了NVIDIA Jarvis,這是一個新的端到端平臺,可以充分發(fā)揮NVIDIA AI平臺的強大功能,創(chuàng)建實時多模態(tài)對話式AI。
他通過一個演示來展示了與名為Misty的AI進行交互的過程,Misty可實時理解并回答一系列有關(guān)天氣的復雜問題。
自2018年在SIGGRAPH上發(fā)布NVIDIA RTX以來,NVIDIA在實時光線追蹤方面取得了迅猛發(fā)展,當時宣布的NVIDIA Omniverse可以讓位于不同地方使用不同工具的設(shè)計師,在同個設(shè)計的不同部分同時工作。現(xiàn)在已經(jīng)可供搶先體驗客戶使用。
自動駕駛汽車
自動駕駛汽車是我們這個時代最大的計算挑戰(zhàn)之一,NVIDIA將持續(xù)通過NVIDIA DRIVE推動整個行業(yè)發(fā)展。
NVIDIA DRIVE將使用全新Orin SoC和NVIDIA Ampere GPU,以實現(xiàn)能效和性能,入門級ADAS系統(tǒng)開發(fā)所需功率僅需5瓦,并為L5級別robotaxi系統(tǒng)提供2,000 TOPS的性能。
現(xiàn)在,汽車制造商僅需單一計算架構(gòu)和軟件堆棧,即可將AI集成到每一輛車中。汽車制造商可以利用一種架構(gòu)來開發(fā)整個車隊,并利用整個車隊來進行軟件開發(fā)。
NVIDIA DRIVE生態(tài)系統(tǒng)現(xiàn)已覆蓋汽車、卡車、一級汽車供應(yīng)商、下一代出行服務(wù)、初創(chuàng)公司、地圖服務(wù)和仿真。NVIDIA將在NVIDIA DRIVE技術(shù)套件中增加用于管理整個自動駕駛車隊的NVIDIA DRIVE RC。
機器人技術(shù)
NVIDIA還將繼續(xù)推進其NVIDIA Isaac軟件定義的機器人平臺,宣布寶馬集團已選擇NVIDIA Isaac機器人技術(shù)為其下一代工廠提供動力。
每56秒鐘,寶馬集團在全球的30家工廠就會生產(chǎn)一輛汽車:40種不同型號的汽車,每種都有數(shù)百種不同的選擇,3000萬個零件來自全球近2,000家供應(yīng)商。
寶馬集團加入了一個龐大的NVIDIA機器人技術(shù)全球生態(tài)系統(tǒng),該生態(tài)系統(tǒng)涵蓋配送、零售、自主移動機器人、農(nóng)業(yè)、服務(wù)業(yè)、物流、制造和醫(yī)療保健。
未來,工廠實際上將成為巨大的機器人。“里面的所有運動部件都會由AI驅(qū)動。”黃仁勛說。“將來,每個批量生產(chǎn)的產(chǎn)品都將被逐一量身定制。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5182瀏覽量
105366 -
gpu
+關(guān)注
關(guān)注
28文章
4880瀏覽量
130341 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9579瀏覽量
86923 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5057瀏覽量
73018 -
Ampere
+關(guān)注
關(guān)注
1文章
79瀏覽量
4636
發(fā)布評論請先 登錄
相關(guān)推薦
NVIDIA實現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強功能
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief
NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構(gòu)技術(shù)解析
NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對比
NVIDIA技術(shù)引領(lǐng)媒體行業(yè)AI革新
聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個人AI超級計算機設(shè)計NVIDIA GB10超級芯片
《CST Studio Suite 2024 GPU加速計算指南》
NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用
AMD與NVIDIA GPU優(yōu)缺點
IB Verbs和NVIDIA DOCA GPUNetIO性能測試

評論