世界各地的研究人員將在配備最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超級芯片的系統上,借助生成式 AI 和 HPC 來應對科學和工業領域的重大挑戰。
11 月 13 日,NVIDIA 在 SC23 上發布了一系列新技術,將全球各地的科學和工業研究中心推向性能和能效新高。
NVIDIA 高性能計算和超大規模數據中心業務副總裁 Ian Buck 在 SC 大會發表的特別演講中提到:“NVIDIA 的硬件和軟件創新正在創造一種新型 AI 超級計算機。”
其中一些超級計算機將配備內存增強的 NVIDIA Hopper 加速器,另一些則采用全新 NVIDIA Grace Hopper 系統架構。它們都將使用擴展的并行結構來運行面向生成式 AI 、HPC 和混合量子計算的全棧加速軟件。
Buck 將全新 NVIDIA HGX H200 稱為“世界領先的 AI 計算平臺”。
它配備高達 141 GB 的 HBM3e,是首款使用這項超快技術的 AI 加速器。在運行 GPT-3 等模型時,NVIDIA H200 Tensor Core GPU 的性能比上一代加速器高出 18 倍。

NVIDIA H200 Tensor Core GPU 配備HBM3e 內存,
可運行不斷增長的生成式 AI 模型
在其他生成式AI基準測試中,它們在一個 Llama2-13B 大語言模型(LLM)上每秒可快速通過 12,000 個 token 。
Buck 還展示了一個服務器平臺,該平臺在一個 NVIDIA NVLink 互聯下連接了四個 NVIDIA GH200 Grace Hopper 超級芯片。這一四組芯片的配置使得在一個計算節點內有高達 288 個 Arm Neoverse 核心,以及 2.3 TB 的高速內存 ,實現了 16 petaflops 的 AI 性能。

基于四個 GH200 超級芯片的服務器節點,提供 16 petaflops 的 AI 性能
采用 NVIDIA TensorRT-LLM 開源庫的單個 GH200 超級芯片比一個雙插槽 x86 CPU 系統快 100 倍,比一臺 x86 + H100 GPU 服務器節能近 2 倍,展現了卓越的節能效果。
Buck 說:“加速計算是可持續的計算。通過充分利用加速計算和生成式 AI,我們可以推動各行各業的創新,同時減少對環境的影響。”
新上榜 TOP500 的 49 個系統中
有 38 個采用了 NVIDIA 技術
最新發布的全球最快的超級計算機 TOP500 榜單顯示,人們正在轉向加速、節能的超級計算。
由于諸多新建超級計算機采用了 NVIDIA H100 Tensor Core GPU,NVIDIA 目前在這些世界領先的系統中提供超過 2.5 exaflops 的 HPC 性能,相較此前 5 月榜單中的 1.6 exaflops 有了不少提升。僅在全球超級計算機 Top 10 中,NVIDIA 就提供近 1 exaflop 的 HPC 性能和 72 exaflops 的 AI 性能。
在新榜單中,采用 NVIDIA 技術的超級計算機數量再創新高,從 5 月份的 372 個增加到 379 個,其中包括 49 個新上榜超級計算機中的 38 個。
部署在 Microsoft Azure 中的 Eagle 系統是算力最高的新上榜超級計算機,其采用 H100 GPU,在 NDv5 實例中以 561 petaflops 的算力在總榜中排名第三。巴塞羅那的 Mare Nostrum5 排名第 8 ,而最近在 MLPerf 基準測試中創下 AI 訓練新紀錄的 NVIDIA Eos 排名第 9 。
在 Green500 的前 30 名中有 23 個采用了 NVIDIA GPU ,彰顯了它們的節能優勢。配備 H100 GPU 的 Henri 系統蟬聯第一,它位于紐約 Flatiron 研究所,能效為每瓦 65.09 gigaflops 。
使用生成式 AI 探索新冠病毒
美國阿貢國家實驗室展現了無限可能,它使用 NVIDIA BioNeMo(一個面向生物分子大語言模型的生成式 AI 平臺)開發了 GenSLM 模型。這個模型可以生成與冠狀病毒的現實變種非常相似的基因序列。使用 NVIDIA GPU 以及來自 150 萬個新冠病毒基因組序列的數據,它還可以快速識別出新的病毒變種。
這項工作去年獲得了戈登·貝爾特別獎,并在包括美國阿貢國家實驗室的 Polaris 系統、美國能源部的 Perlmutter 和 NVIDIA 的 Selene 在內的超級計算機上進行了訓練。
NVIDIA 醫療業務副總裁 Kimberly Powell 在此次特別演講中提到:“這只是冰山一角。隨著生成式 AI 不斷重新定義科學探索,未來充滿了無限可能。”
節約時間、金錢和能源
Buck 提到,使用最新技術為工作負載加速可以將系統的成本和能耗降低一個數量級。
例如,西門子與梅賽德斯合作為新其款 EQE 電動汽車分析空氣動力學和相關聲學。這類模擬此前在 CPU 集群上通常耗時數周時間,而借助最新的 NVIDIA H100 GPU ,其速度要快很多。此外,Hopper GPU 使成本降低了 3 倍,能耗降低了 4 倍(如下如所示)。

明年將開啟 200 Exaflops 時代
在全球各地,部署這些最新系統將推動科學和工業領域不斷取得進步。
Buck 說:“我們已經看到,2024 年將有基于 Grace Hopper 超級計算機的總計 200 exaflopsAI 算力投入生產。”
其中包括德國于希利研究中心的大型 JUPITER 超級計算機。它可以為 AI 訓練提供 93 exaflops 的性能,為 HPC 應用提供 1 exaflop 的性能,而能耗僅為 18.2 兆瓦。

GH200 為研究中心帶來性能飆升
基于 Eviden 的 BullSequana XH3000 液冷系統,JUPITER 將使用 NVIDIA quad GH200 系統架構和 NVIDIA Quantum-2 InfiniBand 網絡,用于進行氣候和天氣預測、藥物發現、混合量子計算和數字孿生。JUPITER 所采用的 quad GH200 節點將配置 864 GB 的高速內存。
這是 NVIDIA 在 SC23 上宣布的數個使用 Grace Hopper 的新型超級計算機之一。
慧與(Hewlett Packard Enterprise)的 HPE Cray EX2500 系統將為明年投入使用的眾多AI超級計算機配備 quad GH200。
例如,慧與建設的 OFP-II(一個由日本筑波大學和東京大學共享的先進 HPC 系統)以及 DeltaAI 系統(將使美國國家超級計算應用中心的算力提升三倍)均將采用 quad GH200。
HPE 正在為美國洛斯阿拉莫斯國家實驗室建造 Venado 系統,這是在美國部署的首個 GH200,其還將在中東、瑞士和英國建設更多 GH200 超級計算機。
德克薩斯及更多地區采用 Grace Hopper
在德克薩斯高級計算中心(TACC),戴爾科技集團正在使用 NVIDIA Grace Hopper 和 Grace CPU 超級芯片建造 Vista 超級計算機。
Buck 表示,包括美國航空航天局艾姆斯研究中心(NASA Ames Research Center)和 Total Energies 在內的全球 100 多個企業和組織已經采購了 Grace Hopper 早期訪問系統。
此前已宣布采用 GH200 的用戶包括軟銀和布里斯托大學,以及配備 14000 個 NVIDIA A100 GPU 的大型 Leonardo 系統,后者為意大利 Cineca 聯盟提供 10 exaflops 的 AI 性能。
超算中心的觀點
來自世界各地超算中心的主管介紹了他們采用最新系統的計劃及進展。
瑞士國家超級計算中心負責阿爾卑斯超級計算機的主任 Thomas Schultess 表示:“我們一直在與 MeteoWiss ECMWP 以及參與 ETH EXCLAIM 和 NVIDIA Earth-2 計劃的科學家合作打造一個基礎設施,以期在大數據分析和超大規模計算的各個方面取得突破。”
德克薩斯高級計算中心(TACC)的執行主任 Dan Stanzione 在談到 Vista 時表示:“我們的各個堆棧都極大提升了能效。”
他說:“這真的是一塊墊腳石,推動用戶從過去使用的系統轉向這種將 Grace Arm CPU 和 Hopper GPU 緊密配合的新系統,而且……我們希望在幾年后部署 Horizon 時,其規模將是 Vista 的 10 或 15 倍。”
加速量子進程
研究人員們還在利用當今的加速系統開拓通往未來超級計算機的道路。
于利希研究中心量子信息處理研究小組負責人 Kristel Michelson 表示,在德國,JUPITER 超級計算機“將徹底改變氣候、材料、藥物發現和量子計算領域的科研工作”。
她說:“ JUPITER 的架構還允許量子算法與并行 HPC 算法無縫集成,這對于有效的量子 HPC 混合模擬來說是必需的。”
CUDA Quantum 推動進步
此次演講還展示了 NVIDIA CUDA Quantum —— 一個用于編程 CPU、GPU 和 QPU(量子計算機)的平臺,是如何推進量子計算研究的。
例如,全球最大的化工企業巴斯夫的研究人員開創了一種新的混合量子經典方法,用于模擬可以保護人類免受有害金屬侵害的化合物。此外,美國布魯克海文國家實驗室和 HPE 的研究人員也分別在利用 CUDA Quantum 推動前沿科研工作。
NVIDIA 還宣布與量子編程工具開發商 Classiq 合作,在以色列最大的教學醫院 Tel Aviv Sourasky Medical Center 創建一個生命科學研究中心。該中心將使用 Classiq 軟件和運行于 NVIDIA DGX H100 系統之上的 CUDA Quantum 。
另外,Quantum Machines 公司將在以色列國家量子中心部署首個配備 Grace Hopper 超級芯片的 NVIDIA DGX Quantum ,旨在推動各個科學領域的進步。這個 DGX 系統將連接到一臺 Quantware 的超導 QPU 和一臺 ORCA Computing 的光子 QPU,兩者均由 CUDA Quantum 驅動。

Buck 說:“在短短兩年內,NVIDIA 的量子計算平臺已經擁有 120 多個合作伙伴(如上圖),這證明它是一個開放、創新的平臺。”
總的來說,諸多科研領域的工作揭示了一種新趨勢,那就是將數據中心規模的加速計算與 NVIDIA 的全棧創新相結合。
他總結道:“加速計算正在為可持續計算鋪平道路,并且已經取得了諸多進步,不僅提供令人驚嘆的技術,而且將開創更加可持續、更有影響力的未來。”
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”或掃描下方海報二維碼,立即注冊 GTC 大會。
原文標題:SC23 | 新型加速節能 AI 系統開創超級計算的新時代
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3900瀏覽量
92916
原文標題:SC23 | 新型加速節能 AI 系統開創超級計算的新時代
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代
聯想集團領跑AI普惠新時代
英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
當我問DeepSeek AI爆發時代的FPGA是否重要?答案是......
NVIDIA JetPack 6.2引入Super模式

星河AI加速新時代教育數智化轉型
NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

NVIDIA助力丹麥發布首臺AI超級計算機
NVIDIA和Recursion利用AI超級計算機加快新藥研發

評論