在法蘭克福舉辦的全球超級(jí)計(jì)算大會(huì)上,重磅消息傳來(lái),NVIDIA宣布CUDA支持Arm CPU,為高性能計(jì)算開(kāi)辟全新途徑,以構(gòu)建具有極高能效水平的百萬(wàn)兆級(jí)AI超級(jí)計(jì)算機(jī)。北京時(shí)間6月17日下午四點(diǎn),NVIDIA與媒體召開(kāi)電話會(huì)議。下文將詳解雙方合作始末,以及<電子發(fā)燒友>獨(dú)家求證后獲知的信息。
NVIDIA攜手Arm意欲何在?
隨著傳統(tǒng)計(jì)算規(guī)模擴(kuò)展步伐的停止,功率將成為所有超級(jí)計(jì)算機(jī)的限制因素。對(duì)于與Arm的攜手,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA CUDA加速的計(jì)算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實(shí)現(xiàn)大幅提升,以達(dá)到百萬(wàn)兆級(jí)。”雙方合作的原因主要有兩方面:首先,客戶(hù)需要更多選擇,一旦完成堆棧優(yōu)化,Nvidia將加速所有主要CPU架構(gòu),包括x86、Power和ARM;其次,通過(guò)將NVIDIA軟件棧引入Arm生態(tài)系統(tǒng),將進(jìn)一步助推在HPC服務(wù)器市場(chǎng)的創(chuàng)新。
年底前,NVIDIA將向Arm生態(tài)系統(tǒng)提供全堆棧的AI和HPC軟件,該堆棧為600多個(gè)HPC應(yīng)用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫(kù)、GPU加速的AI框架和軟件開(kāi)發(fā)工具,如支持OpenACC的PGI編譯器和性能分析器。
NVIDIA解決方案架構(gòu)與工程團(tuán)隊(duì)副總裁Marc Hamilton透露,NVIDIA和Arm已為這個(gè)計(jì)劃準(zhǔn)備了兩年左右,認(rèn)為現(xiàn)在是最佳的發(fā)布時(shí)機(jī)。建立在雙方超過(guò)10年的合作基礎(chǔ)之上,此前,NVIDIA幾款用于便攜式游戲、自動(dòng)駕駛汽車(chē)、機(jī)器人和嵌入式AI計(jì)算的系統(tǒng)級(jí)芯片產(chǎn)品都采用了Arm。全球眾多涉及超級(jí)計(jì)算的項(xiàng)目或單位都在尋求Arm的加入,包括歐洲處理器計(jì)劃(European Processor Initiative)、日本先進(jìn)情報(bào)項(xiàng)目中心 (RIKEN)、美國(guó)能源部的先鋒項(xiàng)目(DOE Vanguard project)等。
合作僅止于HPC軟件方面?還是會(huì)進(jìn)一步影響到某些應(yīng)用市場(chǎng)?NVIDIA表示,合作同時(shí)也是對(duì)于其他平臺(tái)的補(bǔ)充,例如Jetson Xavier,并將進(jìn)一步拓展在數(shù)據(jù)中心和HPC平臺(tái)的合作。
超算競(jìng)爭(zhēng)再加劇
在超級(jí)計(jì)算機(jī)中使用基于Arm的體系結(jié)構(gòu)是值得注意的,和其他架構(gòu)相比,Arm的一大特色在于出色的能效,能夠?yàn)槌?jí)計(jì)算提供開(kāi)放式架構(gòu),用戶(hù)可以實(shí)現(xiàn)更為高度的集成。對(duì)于需要快速處理和分析大型數(shù)據(jù)集的研究密集型任務(wù),能夠滿足內(nèi)存容量和可擴(kuò)展性需求。Arm已經(jīng)在世界各地的許多HPC中心獲得了越來(lái)越多的關(guān)注,NVIDIA支持Arm CPU后,將為研發(fā)超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發(fā)者可以通過(guò)這種方式獲得更多的自主控制能力。對(duì)于已經(jīng)選擇了Arm CPU的用戶(hù)來(lái)說(shuō),他們同時(shí)可以獲得NVIDIA GPU加速計(jì)算選項(xiàng)。CUDA強(qiáng)大的軟件能力,將能夠和Arm的軟件生態(tài)無(wú)縫銜接,強(qiáng)強(qiáng)聯(lián)合。
一直以來(lái),Arm并沒(méi)有放棄將其處理器擴(kuò)展至高性能計(jì)算領(lǐng)域的堅(jiān)持。近年來(lái)大的舉動(dòng)有:2016年8月宣布將與日本富士通公司合作,開(kāi)發(fā)一個(gè)以64位ARMv8-A驅(qū)動(dòng)的Post K超級(jí)計(jì)算機(jī),并于當(dāng)年12月宣布收購(gòu)Allinea Software公司,后者主要為超級(jí)計(jì)算機(jī)提供性能分析工具。在2018年11月的TOP500列表上,首次出現(xiàn)了Arm的身影,而且是安裝在大名鼎鼎的美國(guó)桑迪亞國(guó)家實(shí)驗(yàn)室。與此同時(shí),Cray于2018年11月在英國(guó)氣象局交付了一臺(tái)基于Arm的超級(jí)計(jì)算機(jī)"Isambard",而日本的下一代超級(jí)計(jì)算機(jī)"Post-K"也同樣基于Arm架構(gòu)。
超算未來(lái)將更為注重能耗
超算屆有兩個(gè)重要排名:TOP500和Green500。TOP500主要按照性能基準(zhǔn),提供通用高端應(yīng)用的系統(tǒng)排名。而相比TOP500,Green500除了追求運(yùn)算速度,更加重視超算的能耗問(wèn)題。根據(jù)今年剛剛發(fā)布的Green500排行榜,在全球最節(jié)能的25款超級(jí)計(jì)算機(jī)中,有22款都得益于NVIDIA的支持。關(guān)鍵因素在于:采用NVIDIA GPU的超級(jí)計(jì)算機(jī)能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優(yōu)化整體超級(jí)計(jì)算集群的處理;以及NVIDIA發(fā)明的SXM 3D封裝和可實(shí)現(xiàn)極密集型擴(kuò)展節(jié)點(diǎn)的NVIDIA NVLink互連技術(shù)。
攜手打造超豪華“朋友圈”
包括超算中心和系統(tǒng)提供商以及系統(tǒng)級(jí)芯片制造商等在內(nèi)的眾多HPC行業(yè)及Arm生態(tài)系統(tǒng)中的全球領(lǐng)先企業(yè),都表達(dá)了其對(duì)于NVIDIA攜手Arm的支持。對(duì)于超算百萬(wàn)兆級(jí)時(shí)代的愿景,Cray認(rèn)為主要在于將AI和分析與建模、仿真相結(jié)合的系統(tǒng),這些系統(tǒng)能夠支持、也經(jīng)常需要為科學(xué)、工程和數(shù)字化轉(zhuǎn)型所需的數(shù)據(jù)密集型工作負(fù)載構(gòu)建的多種處理器架構(gòu)和系統(tǒng)。Cray系統(tǒng)管理和編程環(huán)境(編譯器、庫(kù)和工具)已經(jīng)能夠在XC和未來(lái)的Shasta超級(jí)計(jì)算機(jī)上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺(tái),并將其與Cray系統(tǒng)管理和編程環(huán)境緊密集成,能夠助力其超級(jí)計(jì)算機(jī)實(shí)現(xiàn)最終愿景。
“歐洲處理器計(jì)劃(European Processor Initiative,EPI)總經(jīng)理Philippe Notton則表示,打造歐盟自己的高端、低功耗、通用和加速器解決方案,EPI和其工業(yè)合作伙伴SiPearl非常看好NVIDIA所帶來(lái)的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結(jié)合,能夠匹配未來(lái)歐洲百萬(wàn)兆級(jí)模塊化超級(jí)計(jì)算機(jī)中的構(gòu)建模塊。”
考慮到未來(lái)幾年內(nèi)百萬(wàn)兆級(jí)系統(tǒng)和大規(guī)模AI計(jì)算的興起,Jülich超算中心負(fù)責(zé)人Thomas Lippert表示, NVIDIA對(duì)Arm處理器的支持是非常令人興奮的發(fā)展,對(duì)于實(shí)現(xiàn)未來(lái)超級(jí)計(jì)算機(jī)和可組合數(shù)據(jù)中心的真正模塊化至關(guān)重要。
在HPC網(wǎng)絡(luò)方面處于領(lǐng)先地位的Mellanox Technologies,其InfiniBand和以太網(wǎng)技術(shù)連接了全球多款大型的超級(jí)計(jì)算機(jī),其中就包括第一代基于Arm的各系統(tǒng)。該公司創(chuàng)始人兼首席執(zhí)行官Eyal Waldman希望通過(guò)持續(xù)合作,部署200Gb/s HDR和計(jì)算網(wǎng)絡(luò)技術(shù),以?xún)?yōu)化HPC和AI工作負(fù)載,并實(shí)現(xiàn)新一代基于Arm的超級(jí)計(jì)算機(jī)的超級(jí)連接。
百萬(wàn)兆級(jí)意義何在?
全球超級(jí)計(jì)算機(jī)競(jìng)賽正朝著“百萬(wàn)兆級(jí)計(jì)算”這個(gè)里程碑似的目標(biāo)前進(jìn)著。百萬(wàn)兆級(jí)意味著什么?一個(gè)百萬(wàn)兆級(jí)的計(jì)算機(jī)一瞬間進(jìn)行的計(jì)算量,相當(dāng)于地球上所有人每天每秒都不停地計(jì)算四年。
這種非凡的力量將使研究人員能夠進(jìn)行大規(guī)模復(fù)雜的模擬,從而在許多領(lǐng)域取得進(jìn)展,從氣候科學(xué)到基因組學(xué)、可再生能源和人工智能。田納西大學(xué)的超級(jí)計(jì)算機(jī)專(zhuān)家Jack Dongarra曾說(shuō)過(guò):“百萬(wàn)兆級(jí)的計(jì)算機(jī)是一項(xiàng)有力的科學(xué)工具,就像粒子對(duì)撞機(jī)或巨型望遠(yuǎn)鏡一樣。”這些機(jī)器在工業(yè)上也很有用,它們可以被用于加速產(chǎn)品設(shè)計(jì)和識(shí)別新材料。軍方和情報(bào)機(jī)構(gòu)也渴望這樣的超級(jí)計(jì)算機(jī)能夠?qū)⒈挥糜诰S護(hù)國(guó)家安全。超級(jí)計(jì)算機(jī)是促進(jìn)科學(xué)發(fā)現(xiàn)的重要工具,建立百萬(wàn)兆級(jí)超級(jí)計(jì)算將能夠極大地?cái)U(kuò)展人類(lèi)知識(shí)的邊界。
-
ARM
+關(guān)注
關(guān)注
134文章
9286瀏覽量
374423 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5213瀏覽量
105648 -
超級(jí)計(jì)算
+關(guān)注
關(guān)注
1文章
41瀏覽量
11390 -
HPC
+關(guān)注
關(guān)注
0文章
331瀏覽量
24164 -
CUDA
+關(guān)注
關(guān)注
0文章
122瀏覽量
14035
發(fā)布評(píng)論請(qǐng)先 登錄
超七類(lèi)網(wǎng)線支持多少兆

業(yè)界首個(gè)華為發(fā)布全液冷兆瓦級(jí)超充 補(bǔ)能效率較傳統(tǒng)快充樁提升近4倍
大算力芯片的生態(tài)突圍與算力革命
兆瓦超充已來(lái),40kW模塊急需升級(jí)
TASKING編譯器全面支持兆易創(chuàng)新GD32A7x車(chē)規(guī)級(jí)MCU
使用NVIDIA CUDA-X庫(kù)加速科學(xué)和工程發(fā)展
NVIDIA發(fā)布個(gè)人超算利器project digital,標(biāo)志著ai元年的開(kāi)啟

NVIDIA加速全球大多數(shù)超級(jí)計(jì)算機(jī)推動(dòng)科技進(jìn)步

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU
iQOO 13首發(fā)電競(jìng)芯片Q2,獨(dú)家支持2K分辨率
ARMxy工業(yè)控制器為視頻監(jiān)控提供1Tops算力支持

預(yù)定下代超算第一?富士通144核Arm處理器公開(kāi)

評(píng)論