天域苍穹,穿越小说完本,古风小说君子以泽

在法蘭克福舉辦的全球超級計算大會上，重磅消息傳來，NVIDIA宣布CUDA支持Arm CPU，為高性能計算開辟全新途徑，以構建具有極高能效水平的百萬兆級AI超級計算機。北京時間6月17日下午四點，NVIDIA與媒體召開電話會議。下文將詳解雙方合作始末，以及<電子發燒友>獨家求證后獲知的信息。

NVIDIA攜手Arm意欲何在？

隨著傳統計算規模擴展步伐的停止，功率將成為所有超級計算機的限制因素。對于與Arm的攜手，NVIDIA創始人兼首席執行官黃仁勛表示：“NVIDIA CUDA加速的計算和Arm的高能效CPU架構的相結合，將助力HPC社區實現大幅提升，以達到百萬兆級。”

雙方合作的原因主要有兩方面：首先，客戶需要更多選擇，一旦完成堆棧優化，Nvidia將加速所有主要CPU架構，包括x86、Power和ARM；其次，通過將NVIDIA軟件棧引入Arm生態系統，將進一步助推在HPC服務器市場的創新。

年底前，NVIDIA將向Arm生態系統提供全堆棧的AI和HPC軟件，該堆棧為600多個HPC應用程序和所有AI框架提供加速，其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發工具，如支持OpenACC的PGI編譯器和性能分析器。

NVIDIA解決方案架構與工程團隊副總裁Marc Hamilton透露，NVIDIA和Arm已為這個計劃準備了兩年左右，認為現在是最佳的發布時機。建立在雙方超過10年的合作基礎之上，此前，NVIDIA幾款用于便攜式游戲、自動駕駛汽車、機器人和嵌入式AI計算的系統級芯片產品都采用了Arm。全球眾多涉及超級計算的項目或單位都在尋求Arm的加入，包括歐洲處理器計劃（European Processor Initiative）、日本先進情報項目中心 (RIKEN)、美國能源部的先鋒項目（DOE Vanguard project）等。

合作僅止于HPC軟件方面？還是會進一步影響到某些應用市場？NVIDIA表示，合作同時也是對于其他平臺的補充，例如Jetson Xavier，并將進一步拓展在數據中心和HPC平臺的合作。

超算競爭再加劇

在超級計算機中使用基于Arm的體系結構是值得注意的，和其他架構相比，Arm的一大特色在于出色的能效，能夠為超級計算提供開放式架構，用戶可以實現更為高度的集成。對于需要快速處理和分析大型數據集的研究密集型任務，能夠滿足內存容量和可擴展性需求。

Arm已經在世界各地的許多HPC中心獲得了越來越多的關注，NVIDIA支持Arm CPU后，將為研發超算的研究人員們提供了除英特爾和IBM外的第三種選擇，并使得研發者可以通過這種方式獲得更多的自主控制能力。對于已經選擇了Arm CPU的用戶來說，他們同時可以獲得NVIDIA GPU加速計算選項。CUDA強大的軟件能力，將能夠和Arm的軟件生態無縫銜接，強強聯合。

一直以來，Arm并沒有放棄將其處理器擴展至高性能計算領域的堅持。近年來大的舉動有：2016年8月宣布將與日本富士通公司合作，開發一個以64位ARMv8-A驅動的Post K超級計算機，并于當年12月宣布收購Allinea Software公司，后者主要為超級計算機提供性能分析工具。在2018年11月的TOP500列表上，首次出現了Arm的身影，而且是安裝在大名鼎鼎的美國桑迪亞國家實驗室。與此同時，Cray于2018年11月在英國氣象局交付了一臺基于Arm的超級計算機"Isambard"，而日本的下一代超級計算機"Post-K"也同樣基于Arm架構。

超算未來將更為注重能耗

超算屆有兩個重要排名：TOP500和Green500。TOP500主要按照性能基準，提供通用高端應用的系統排名。而相比TOP500，Green500除了追求運算速度，更加重視超算的能耗問題。

根據今年剛剛發布的Green500排行榜，在全球最節能的25款超級計算機中，有22款都得益于NVIDIA的支持。關鍵因素在于：采用NVIDIA GPU的超級計算機能夠將繁重的處理作業卸載至更為節能的并行處理CUDA GPU之上；NVIDIA與Mellanox合作優化整體超級計算集群的處理；以及NVIDIA發明的SXM 3D封裝和可實現極密集型擴展節點的NVIDIA NVLink互連技術。

攜手打造超豪華“朋友圈”

包括超算中心和系統提供商以及系統級芯片制造商等在內的眾多HPC行業及Arm生態系統中的全球領先企業，都表達了其對于NVIDIA攜手Arm的支持。

對于超算百萬兆級時代的愿景，Cray認為主要在于將AI和分析與建模、仿真相結合的系統，這些系統能夠支持、也經常需要為科學、工程和數字化轉型所需的數據密集型工作負載構建的多種處理器架構和系統。Cray系統管理和編程環境（編譯器、庫和工具）已經能夠在XC和未來的Shasta超級計算機上支持Arm處理器，將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺，并將其與Cray系統管理和編程環境緊密集成，能夠助力其超級計算機實現最終愿景。

“歐洲處理器計劃（European Processor Initiative，EPI）總經理Philippe Notton則表示，打造歐盟自己的高端、低功耗、通用和加速器解決方案，EPI和其工業合作伙伴SiPearl非常看好NVIDIA所帶來的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結合，能夠匹配未來歐洲百萬兆級模塊化超級計算機中的構建模塊。”

考慮到未來幾年內百萬兆級系統和大規模AI計算的興起，Jülich超算中心負責人Thomas Lippert表示， NVIDIA對Arm處理器的支持是非常令人興奮的發展，對于實現未來超級計算機和可組合數據中心的真正模塊化至關重要。

在HPC網絡方面處于領先地位的Mellanox Technologies，其InfiniBand和以太網技術連接了全球多款大型的超級計算機，其中就包括第一代基于Arm的各系統。該公司創始人兼首席執行官Eyal Waldman希望通過持續合作，部署200Gb/s HDR和計算網絡技術，以優化HPC和AI工作負載，并實現新一代基于Arm的超級計算機的超級連接。

百萬兆級意義何在？

全球超級計算機競賽正朝著“百萬兆級計算”這個里程碑似的目標前進著。

百萬兆級意味著什么？一個百萬兆級的計算機一瞬間進行的計算量，相當于地球上所有人每天每秒都不停地計算四年。

這種非凡的力量將使研究人員能夠進行大規模復雜的模擬，從而在許多領域取得進展，從氣候科學到基因組學、可再生能源和人工智能。田納西大學的超級計算機專家Jack Dongarra曾說過：“百萬兆級的計算機是一項有力的科學工具，就像粒子對撞機或巨型望遠鏡一樣。”這些機器在工業上也很有用，它們可以被用于加速產品設計和識別新材料。軍方和情報機構也渴望這樣的超級計算機能夠將被用于維護國家安全。超級計算機是促進科學發現的重要工具，建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴