2020年12月15日,在GTC中國大會上,NVIDIA首席科學家,NVIDIA研究院高級副總裁BillDally分享了團隊正在研發的技術。
Ampere技術在高性能計算方面有著卓越成效
“我們打造了性能非凡的高性能計算設備,致力于解決世界上極為苛刻的計算問題,所有這一切的基礎都是硬件?!盉ill Dally說。
圖:NVIDIA首席科學家,NVIDIA研究院高級副總裁Bill Dally
Bill Dally首先介紹了Ampere,他說:“AmpereA100SXM模塊具有處理海量計算的性能,借助這一模塊,可以擴展Ampere的功能,從而解決非??量痰挠嬎銌栴}?!?/p>
并且如果用戶還想擴展,可以取8個這樣的是Ampere,將其放入DGX機箱中,Bill Dally說:“我們可以在機架中安裝多個DGX機箱與Mellanox交換機,打造世界上性能最強大的計算機?!?/p>
硬件本身并不能解決世界上的難題,還需要借助軟件來集中這種強大的計算能力應對苛刻的問題,BillDally表示,為了實現這一目標,NVIDIA投入了大量的精力來開發軟件套件。
NVIDIA很早推出了CUDA,自2006年以來,人們一直使用CUDA來充分利用GPU的功能,為了方便人們在CUDA上構建應用程序,NVIDIA還提供了一整套開發庫。
NVIDIA有大量的軟件可以用來支持人工智能,包括用于自然語音處理和推薦系統的軟件。
在醫療健康領域,NVIDIA推出了Clare軟件包,它應用廣泛,從Parabricks基因組測序分析到圖像分析,再到挖掘醫學論文數據庫等,都可以使用。NVIDIA還提供了應用于智能視頻分析的軟件包,可以用來獲取視頻流,并根據所見得出結論。此外,NVIDIA還有一個適用于自動駕駛汽車的完整軟件包,從在數據中心內組織數據集訓練到車輛中進行自主部署。
NVIDIA A100采用7nm芯片,具有540億個晶體管,而且還具有許多創新功能,相比上一代產品,它的功能更加強大。Bill Dally說:“這是NVIDIA第3代TensorCore,我們將這款特殊硬件集成到GPU中,以加速深度學習,在這一代核心中,我們增加了對新數據類型的支持TensorFLOAT32,解決了曾經在BFLOAT16和FP16之間進行數據類型選擇的問題。”
Ampere的詳細信息
NVIDIA A100的性能能達到1.5倍,在深度學習架構中,這是一個巨大飛躍,Bill Dally表示:我們使用這些A100,并將8個A100與大量SSD存儲、大量RAM和9個Mellanox ConnectX-6 NIC組裝在一起構建一臺設備,這將組成一個性能出眾的計算平臺,該平臺的性能將是其中一個GPU的8倍。
Ampere技術不僅在于其在深度學習方面表現出色,還在于它在高性能計算方面也有著卓著成效,而且還簡化了AI與科學應用的結合。
NVIDIA研究院正在研究的項目
接著,Bill Dally通過NVIDIA研究院正在研究的項目,闡述了自己帶領的200人的研究團隊如何成功實現“黃氏定律(Huang’s Law)”。
這則定律以NVIDIA首席執行官黃仁勛(Jensen Huang)名字命名,預測GPU將推動AI性能實現逐年翻倍。Bill Dally說:“如果我們真想提高計算機性能,黃氏定律就是一項重要指標,且在可預見的未來都將一直適用?!?/p>
NVIDIA助力AI推理性能每年提升一倍以上
為實現這一突破,NVIDIA研究人員專門開發了一種名為MAGNet的工具,其生成的AI推理加速器在模擬測試中,能夠達到每瓦100teraops的推理能力,比目前的商用芯片高出一個數量級。
MAGNet采用了一系列新技術來協調并控制通過設備的信息流,最大限度地減少數據傳輸,而數據傳輸正是當今芯片中最耗能的環節。這一研究原型以模組化實現,因此能夠靈活擴展。
另外,研究團隊還開展了一項研究,旨在以更快速的光鏈路取代現有系統內的電氣鏈路。
Bill Dally擁有120多項專利,在2009年加入NVIDIA之前,曾任斯坦福大學計算機科學系主任。Bill Dally表示:“我們可以將連接GPU的NVLink速度提高一倍,也許還會再翻番,但電子信號最終會消耗殆盡?!?/p>
該團隊正在與哥倫比亞大學的研究人員密切合作,探討如何利用電信供應商在其核心網絡中所采用的技術,通過一條光纖來傳輸數十路信號。
這種名為“密集波分復用”的技術,有望在僅一毫米大小的芯片上實現Tb/s級數據的傳輸,是如今互連密度的十倍以上。
除了更大的吞吐量,光鏈路也有助于打造更為密集型的系統。Dally舉例展示了一個未來將搭載160多個GPU的NVIDIA DGX系統模型。
工程師借助光鏈路,在單一系統中可搭載160多個GPU
軟件方面,NVIDIA的研究人員開發了全新編程系統原型Legate。開發者借助Legate,即可在任何規模的系統上,運行針對單一GPU編寫的程序——甚至適用于諸如Selene等搭載數千個GPU的巨型超級計算機。
Legate將一種新的編程速記融入了加速軟件庫和高級運行時環境Legion,目前它正在美國國家實驗室接受測試。
中國市場對NVIDIA至關重要
在探討“NVIDIA科技助推中國產業創新”這個話題的時候,NVIDIA全球業務運營執行副總裁JAY PURI談到,中國應用AI為行業提供競爭優勢的能力一直處于最前沿,世界上一些極為重要的AI研究人員都在中國,創業生態系統充滿活力,NVIDIA在中國進行了大量投資,中國市場對NVIDIA至關重要。
-
NVIDIA
+關注
關注
14文章
5194瀏覽量
105503 -
gtc
+關注
關注
0文章
73瀏覽量
4540
發布評論請先 登錄
谷歌Gemini API最新進展
商湯絕影王曉剛亮相NVIDIA GTC 2025并發表主題演講
黃仁勛GTC2025演講:人工智能的終極形態物理AI將徹底改變世界

NVIDIA GTC 2025大會即將啟幕
FF將發布FX品牌最新進展
芯片和封裝級互連技術的最新進展
高燃回顧|第三屆OpenHarmony技術大會精彩瞬間
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
中國科學院西安光機所智能光學顯微成像研究取得新進展

評論