超級計算機+AI:NVIDIA Ampere架構開辟百萬兆級時代
目前,全球有6座超級計算機中心率先采用 NVIDIA Ampere架構,將從天體物理學到病毒微生物學等多個科學領域帶入百萬兆級時代。
這些位于美國和德國的高性能計算中心(HPC)將共計使用近13,000個A100 GPU。
這些GPU的總峰值性能超過250 petaflops,將被用于使用64位浮點數學運算的模擬。而對于使用混合精度數學和利用A100 GPU對稀疏性支持的AI推理工作,它們可提供驚人的8.07 exaflops性能。
研究人員將運用這一強大性能從多個維度推動科學發展。他們計劃模擬更大型的模型、訓練和部署更深入的網絡,并開拓運用AI來輔助模擬的新興混合領域。
Argonne國家實驗室是首批NVIDIA DGX-A100系統的使用者之一。圖片由Argonne國家實驗室提供
Argonne國家實驗室(Argonne National Laboratory)的研究人員將通過模擬冠狀病毒(由多達150萬個原子組成)刺突蛋白的關鍵部分來研發新冠病毒疫苗。
Argonne國家實驗室計算生物學家Arvind Ramanathan表示,刺突蛋白分子很難模擬,但A100可以加快對這些子系統的模擬,讓我們了解這種病毒如何感染人類。”Argonne國家實驗室將采用一個由24個NVIDIA DGX A100系統組成的集群。
他還表示,在其他項目中,“由于一次可以掃描數不計其數的藥物,我們的新藥研發能力明顯增強。我們可能會了解之前所無法了解的知識,比如兩種蛋白質如何相互結合等。”
A100為科學研究引入AI
Ramanathan表示:“許多工作難以在計算機上模擬,因此我們可以運用AI來智能指導下一步的采樣地點和時間。”
而這只是科學家使用AI引導模擬這一新興趨勢的冰山一角。Ramanathan還告訴我們,GPU將把生物樣品的處理時間縮短“至少兩個數量級”。
國家能源研究科學計算中心(NERSC)有望成為全美第一批A100使用者中,規模最大的使用者。這座位于加利福尼亞州伯克利(Berkeley, Calif.)的計算中心正在與惠普(Hewlett Packard)合作,在其預制的百萬兆級系統Perlmutter中部署6200個GPU。
NERSC主任Sudip Dosanjh表示:“在NERSC科學和算法領域,一個V100 GPU的性能比我們當前一代Cori系統上的KNL CPU節點高出5倍,我們期待著Perlmutter上的A100性能會更加強大。”
百萬兆級計算團隊使用AI進行模擬
NERSC的百萬兆級計算專用團隊已為Perlmutter確認了近30個項目,這些項目采用了大規模模擬、數據分析或深度學習技術。一些項目將高性能計算與AI相結合,比如使用強化學習控制光源實驗的項目、使用生成模型在高能物理探測器上重現成本昂貴的模擬等。
NERSC的2個高性能計算應用程序,已經原型化了A100 GPU雙精度Tensor核心的使用。相比上一代Volta GPU,它們的性能顯著提高。
NERSC的高性能計算性能工程師Christopher Daley,在GTC 線上大會的一次演講中表示,未來的百萬兆級系統將使用專為10000路并行Perlmutter GPU產品而優化的軟件。NERSC支持天體物理學、地球科學、聚變能和基因組學等領域的近千種科學應用。
NERSC的首席架構師Nicholas Wright表示:“在Perlmutter上,我們需要支持用戶所需和期望的所有編程模型的編譯器,包括MPI、OpenMP、OpenACC、CUDA和經過優化的數學庫。而這些在NVIDIA HPC SDK上都有。”
德國努力繪制大腦圖譜
AI將成為全新70 petaflops系統首批A100應用的重點技術,該系統由法國Atos專為德國西部尤利西超級計算中心(Jülich Supercomputing Center)設計。
比如能夠作出快速短期天氣預報的Deep Rain將對傳統系統(進行大規模,但速度慢的大氣模擬)進行補充。另一個項目計劃構建人腦纖維圖集,并結合數千張高分辨率2D腦圖像進行深度學習。
尤利西采用的新型A100系統還將幫助研究人員,進一步理解結合夸克(物質的亞原子構造模塊)所具有的強大力量。氣候科學項目將可以建立地球地表和地下水流的宏觀模型。
理論物理學家Dirk Pleiter目前管理尤利西應用技術研發團隊。他表示:“許多應用程序都受到存儲的限制。因此,我們最感興趣的是A100存儲占用量和帶寬的增加情況。”
全新GPU能夠將雙精度數學運算速度提高多達2.5倍,而這也是一項研究人員迫切需要的功能。他表示:“我認為一旦人們發現有機會提高計算性能,他們會非常希望使用GPU。”
NVLink助跑數據密集型工作
卡爾斯魯厄技術學院(Karlsruhe Institute of Technology, KIT)在尤利西以南約230英里處,與聯想合作建立了一部全新的17 petaflops系統。該系統將在NVIDIA Mellanox 200 Gbit/s InfiniBand網絡上集成740個A100 GPU,從而解決多項重大挑戰,包括:
用于氣候科學的千米級大氣模擬
針對新冠病毒的研究,包括對Folding@home的支持
大型強子對撞機對希格斯玻色子以外粒子物理學的探索
可能取代鋰離子電池的新一代材料研究
AI在機器人技術、語言處理和可再生能源中的應用
KIT超級計算中心主任、計算科學與數學教授Martin Frank表示:“我們的主要工作是數據密集型模擬和AI工作流,因此我們非常需要能夠連接新GPU的第三代NVLink。”
他補充說:“我們也十分期待多實例GPU功能。該功能可以讓每個節點最多擁有28個GPU,而不是原來的只有4個節點,這將使我們的許多應用都大大受益。”
在慕尼黑郊外,馬克斯·普朗克研究所(Max Planck Institute)的計算機中心正在與聯想合作創建一個名為Raven-GPU的系統。該系統集成了768個NVIDIA A100 GPU,將支持天體物理學、生物學、理論化學和新材料科學等領域的工作。該研究所的目標是在今年年底之前安裝Raven-GPU,并且現在正在接受將應用程序移植到A100方面的請求。
印第安納大學系統應對網絡安全威脅
印第安納大學(Indiana University)正在建造Big Red 200(6 petaflops系統)。該系統將使用256個A100 GPU,有望成為美國大學中速度最快的超級計算機。
該項目于6月發布,是最早采用惠普公司Cray Shasta技術的學術中心之一。其他學術中心也將在未來的百萬兆級系統中使用這項技術。
Big Red 200將運用AI應對網絡安全威脅。它還將解決遺傳學方面的巨大挑戰,幫助實現個性化醫療,為氣候建模、物理學和天文學方面的工作提供支持。
-
NVIDIA
+關注
關注
14文章
5299瀏覽量
106267 -
超級計算機
+關注
關注
2文章
472瀏覽量
42452
原文標題:性能躍升:A100 GPU助力高性能計算中心加速科學發展
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA驅動的現代超級計算機如何突破速度極限并推動科學發展

Blue Lion超級計算機將在NVIDIA Vera Rubin上運行
NVIDIA技術賦能歐洲最快超級計算機JUPITER
NVIDIA助力全球最大量子研究超級計算機
NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機

NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

NVIDIA推出個人AI超級計算機Project DIGITS
聯發科與NVIDIA合作 為NVIDIA 個人AI超級計算機設計NVIDIA GB10超級芯片
NVIDIA 推出高性價比的生成式 AI 超級計算機

NVIDIA助力xAI打造全球最大AI超級計算機
NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

評論