全球的超級計算中心都在紛紛利用NVIDIA Quantum InfiniBand網(wǎng)絡上的NVIDIA BlueField DPU將加速計算提升到一個新的水平
在歐洲和美國,HPC開發(fā)者正在利用NVIDIA BlueField-2 DPU內(nèi)的Arm核和加速器的強大功能為超級計算機提供強大助力。
美國洛斯阿拉莫斯國家實驗室(LANL)正在與NVIDIA進行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應用的性能提高30倍。
LANL研究人員預計,使用在NVIDIA Quantum InfiniBand網(wǎng)絡上運行的DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用BlueField以及NVIDIA DOCA軟件框架在計算存儲、模式匹配等領域?qū)崿F(xiàn)技術創(chuàng)新。
面向DPU的開放式API
這些努力還將有助于進一步定義OpenSNAPI,任何人都可通過該應用接口來控制DPU。這是統(tǒng)計計算框架( Unified Communication Framework)的一個項目,Unified Communication Framework是一個旨在實現(xiàn)HPC應用異構計算的聯(lián)盟,成員包括Arm、IBM、NVIDIA、美國國家實驗室和美國的一些大學。
LANL已經(jīng)感受到網(wǎng)絡計算的強大功能,這要歸功于其創(chuàng)建的DPU賦能的存儲系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與DPU和InfiniBand加速器相結合,可為Linux文件系統(tǒng)的關鍵性能部分提供加速。它的性能高達同類存儲系統(tǒng)的30倍,并將成為LANL基礎架構中的關鍵組件。
一位研究人員在近期的LANL博客中表示:“ABoF讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率。”
德克薩斯州打造出云原生超級計算平臺
德克薩斯高級計算中心(TACC)近期也開始在Dell PowerEdge服務器中采用BlueField-2。它將在InfiniBand網(wǎng)絡上使用DPU,使其Lonestar6系統(tǒng)成為云原生超級計算的開發(fā)平臺。
TACC的Lonestar6為德州農(nóng)工大學、德州理工大學和北德克薩斯大學的眾多HPC開發(fā)者,以及一些研究中心和教職人員提供服務。
MPI獲得加速
在距TACC東北部1200英里的地方,俄亥俄州立大學的研究人員展示了DPU如何將一個HPC熱門編程模型的運行速度提高26%。
他們通過卸載消息傳遞接口(MPI)的關鍵部分,加速了P3DFFT,這是一個用于眾多大規(guī)模HPC仿真的數(shù)學庫。
俄亥俄州立大學計算機科學與工程專業(yè)的教授Dhabaleswar K. (DK) Panda在其帶領的MVAPICH開源軟件團隊推動DPU工作,他表示:“DPU就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載。”
HPC中心和云中的DPU
對于運行藥物研發(fā)或飛機設計等HPC仿真應用的超級計算機而言,高達兩位數(shù)的性能加速是驚人的。Panda表示,云服務可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個HPC中心的代碼請求。
Quantum InfiniBand網(wǎng)絡以及NVIDIA SHARP特性,助力他高效完成工作。
他說:“其他人還在談論網(wǎng)絡計算,而InfiniBand已經(jīng)在為它提供支持。”
達勒姆開發(fā)負載均衡
歐洲的多個研究團隊正利用BlueField DPU加速MPI和其他HPC工作負載。
例如,英格蘭北部的達勒姆大學正在開發(fā)一款軟件,用于在16個節(jié)點的Dell PowerEdge集群上使用BlueField DPU以實現(xiàn)MPI作業(yè)的負載均衡。該項目的首席調(diào)查員Tobias Weinzierl表示,該軟件將為全球各地的HPC設施更高效地處理更好算法鋪平道路。
劍橋大學和慕尼黑的DPU應用
劍橋大學、倫敦和慕尼黑的研究人員也在使用DPU。
倫敦大學學院正在探索如何在BlueField-2 DPU上為主機系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。
Dell PowerEdge服務器內(nèi)的BlueField DPU可為Cambridge Service for Data Driven Discovery服務卸載主機CPU的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時,慕尼黑工業(yè)大學計算機體系架構和并行系統(tǒng)組的研究人員正在尋找方法,使用DPU來卸載MPI和操作系統(tǒng)任務,這是EuroHPC項目的一部分。
在美國,佐治亞理工學院的研究人員正在與桑迪亞國家實驗室合作,利用BlueField-2 DPU加速分子動力學研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達20%,且不會損失模擬的準確性。
不斷擴展的網(wǎng)絡
本月早些時候,日本研究人員宣布將推出一款采用新版NVIDIA H100 Tensor Core GPU的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的NVIDIA Quantum-2 InfiniBand網(wǎng)絡平臺。
NEC將使用H100的為筑波大學計算科學中心構建算力大約為6 PFLOPS超級計算機。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學、大數(shù)據(jù)、AI和更多方面的研究。
與此同時,Panda等研究人員已經(jīng)開始考慮如何使用BlueField-3 DPU的核心功能。
他打趣道:“這就像雇傭擁有大學學位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載。”
-
加速器
+關注
關注
2文章
827瀏覽量
39100 -
HPC
+關注
關注
0文章
333瀏覽量
24313 -
網(wǎng)絡計算機
+關注
關注
0文章
3瀏覽量
6630
發(fā)布評論請先 登錄
NVIDIA DOCA 3.0版本的亮點解析

第三屆NVIDIA DPU黑客松開啟報名
研究人員開發(fā)出基于NVIDIA技術的AI模型用于檢測瘧疾
Node?RED可視化拖拽編程實踐-成都縱橫智控EG邊緣計算網(wǎng)關

NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機

NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

利用NVIDIA DPF引領DPU加速云計算的未來

在NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優(yōu)勢

評論