現(xiàn)代高性能計(jì)算不僅使得更快的計(jì)算成為可能,它正驅(qū)動(dòng)著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。
高性能計(jì)算經(jīng)歷了多次迭代,每一次都源于對技術(shù)的創(chuàng)造性再利用。例如,早期的超級計(jì)算機(jī)使用現(xiàn)成的組件制造。后來,研究人員用個(gè)人電腦構(gòu)建了強(qiáng)大的集群,甚至改造游戲顯卡,把它們用于科學(xué)研究。
當(dāng)今的高性能計(jì)算系統(tǒng)專為高速計(jì)算而設(shè)計(jì),其中許多都采用了 NVIDIA 加速計(jì)算技術(shù)。在 ISC 2025 大會(huì)上揭曉的最新全球最快超級計(jì)算機(jī) TOP500 榜單顯示,NVIDIA 為該榜單中 77% 的系統(tǒng)提供動(dòng)力。
與此同時(shí),像 Tensor Core 這樣的創(chuàng)新功能為矩陣乘法等常見運(yùn)算提供了更快的計(jì)算能力,而混合精度等技術(shù)的普及則大幅提升了性能和能效,推動(dòng)了氣候科學(xué)和醫(yī)學(xué)等領(lǐng)域的飛躍式發(fā)展。
NVIDIA 為 TOP500 中名列前茅的系統(tǒng)提供動(dòng)力
NVIDIA 在超算領(lǐng)域繼續(xù)處于領(lǐng)先地位,為最新 TOP500 榜單中的 381 個(gè)系統(tǒng)提供動(dòng)力,包括新進(jìn)躋身前十的于利希超算中心的 JUPITER 超級計(jì)算機(jī)(排名第 4)。
TOP500 前 100 名系統(tǒng)中,目前有 83 個(gè)采用了加速計(jì)算,僅 17 個(gè)只使用了 CPU。
此外,在 Green500 全球最節(jié)能 FP64 超級計(jì)算機(jī)榜單上,前兩名均采用了 NVIDIA GH200 Grace Hopper 超級芯片,前十名中有九個(gè)系統(tǒng)均由 NVIDIA 加速。
Tensor Core 在科學(xué)領(lǐng)域的應(yīng)用
AI 性能的提升不僅源于浮點(diǎn)運(yùn)算量的增加,也越來越多地根植于硬件與軟件的融合,例如對于 Tensor Core 的使用。
Tensor Core 是 NVIDIA GPU 內(nèi)的先進(jìn)組件,專為加速矩陣運(yùn)算(AI 和深度學(xué)習(xí)的核心計(jì)算)而設(shè)計(jì)。通過更高效地處理復(fù)雜計(jì)算,Tensor Core 加速了模型訓(xùn)練和推理等過程。
Tensor Core 加速了常見的矩陣運(yùn)算,尤其是當(dāng)組織轉(zhuǎn)向 FP8 等更低精度進(jìn)行模型訓(xùn)練時(shí)。隨著精度每降低一級,吞吐量就會(huì)提高近一倍,同時(shí)還能保持準(zhǔn)確。目前,只有模擬工作負(fù)載中的某些運(yùn)算可以利用 Tensor Core。這些運(yùn)算通常占總運(yùn)行時(shí)間的一小部分,而且很少對整體性能產(chǎn)生重大影響。
隨著 GPU 上越來越多的物理空間被用于為 AI 構(gòu)建的低精度 Tensor Core,高性能計(jì)算社區(qū)迎來了把這些硬件重新用于推進(jìn)科學(xué)發(fā)現(xiàn)的機(jī)會(huì)。
為此,NVIDIA 正投資開發(fā)新方法,以便將 Tensor Core 用于更廣泛的科學(xué)模擬相關(guān)場景。
RIKEN 研究所計(jì)算科學(xué)中心的 Yuki Uchino 和芝浦工業(yè)大學(xué)教授 Katsuhisa Ozaki 發(fā)表了一篇論文,其中展示了如何利用 Tensor Core 中的整數(shù)矩陣乘法加速器和一種名為 Ozaki scheme 的算法,使 GPU 中的整數(shù)單元能夠?qū)崿F(xiàn)包括 FP64 在內(nèi)的任意精度。
受此方案啟發(fā),NVIDIA 正在開發(fā)相關(guān)庫,以利用更多 GPU Tensor Core 來加速高精度張量和矩陣計(jì)算,聚焦于提升準(zhǔn)確度、性能和能效。
使用這些庫已展現(xiàn)出一些驚人的優(yōu)勢:在一個(gè)硅模擬中,把大約 1000 個(gè)原子暴露在紫外線下,使用這些庫的速度比使用 FP64 硬件快 1.8 倍,而二者輸出相同結(jié)果,這節(jié)省了時(shí)間和能源。
圖 1. 使用原生 FP64 硅和仿真技術(shù)對 998 個(gè)硅原子
進(jìn)行 BerkeleyGW 模擬的性能比較
借助這些新的庫,BerkeleyGW 等常見的高性能計(jì)算模擬將很快能夠利用低精度 Tensor Core,實(shí)現(xiàn)性能和能效的飛躍。
AI 超級計(jì)算推動(dòng)科學(xué)進(jìn)步
盡管 TOP500 榜單凸顯了當(dāng)今超級計(jì)算機(jī)非凡的高精度運(yùn)算速度,但并未體現(xiàn)出它們在通過混合精度和 AI 推動(dòng)科學(xué)發(fā)現(xiàn)方面的巨大影響力。
去年,諾貝爾化學(xué)獎(jiǎng)和物理學(xué)獎(jiǎng)被授予使用 AI 的科研人員,包括 Demis Hassabis 和 John Jumper(因在谷歌 DeepMind 的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型 AlphaFold 上的卓越工作而獲獎(jiǎng)),以及多倫多大學(xué)名譽(yù)教授 Geoff Hinton 和普林斯頓大學(xué)名譽(yù)教授 John Hopfield(因推進(jìn)神經(jīng)網(wǎng)絡(luò)架構(gòu)而獲獎(jiǎng))。
高性能計(jì)算領(lǐng)域的最高榮譽(yù)“戈登·貝爾獎(jiǎng)”授予了 KAUST 的 David Keyes 團(tuán)隊(duì),表彰他們使用混合精度方法來模擬龐大的 ERA5 氣候數(shù)據(jù)集。該數(shù)據(jù)集提供了過去 80 年中每小時(shí)的大氣、陸地和海浪變量估計(jì)值,包含從地表到 80 公里高度的 137 個(gè)海拔層。
混合精度是一種結(jié)合了多種浮點(diǎn)精度格式的技術(shù)。使用較低精度的數(shù)據(jù)類型可提升性能和能效,讓應(yīng)用程序能夠使用更少的資源來實(shí)現(xiàn)更高的性能。
隨著科學(xué)家構(gòu)建新的 AI 模型以加速科學(xué)工作流,混合精度在科學(xué)領(lǐng)域的應(yīng)用日益普及。
在英國,布里斯托大學(xué)的 Isambard-AI 系統(tǒng)(由 NVIDIA Grace Hopper 提供動(dòng)力)使用混合精度來訓(xùn)練 Nightingale 等模型。
Nightingale 是用于醫(yī)療和生物醫(yī)學(xué)研究的多模態(tài)基礎(chǔ)模型,集成了影像、心臟病學(xué)和電子健康記錄。與醫(yī)療領(lǐng)域的其它大語言模型不同,Nightingale 不僅使用基于文本的推理,還利用影像模式和標(biāo)準(zhǔn)診斷技術(shù),結(jié)合海量患者數(shù)據(jù)來提供醫(yī)學(xué)見解。Nightingale 的目標(biāo)是成為其它醫(yī)療應(yīng)用軟件的基礎(chǔ),包括醫(yī)生辦公助手和遠(yuǎn)程醫(yī)療分診系統(tǒng)。
通過使用混合精度,Isambard-AI 實(shí)現(xiàn)了訓(xùn)練 Nightingale 等多模態(tài)大語言模型所需的大規(guī)模和準(zhǔn)確性,而無需為訓(xùn)練或推理配置過多的硬件。
邁向高性能計(jì)算的下一次迭代
加速計(jì)算、先進(jìn)的張量技術(shù)和混合精度方法的結(jié)合,正在改變計(jì)算科學(xué),也展示了 AI 驅(qū)動(dòng)更多突破的潛力。
隨著 JUPITER 等系統(tǒng)入選 TOP500,越來越多的工作借助 AI 來用于科學(xué)研究和創(chuàng)新,如將 Isambard-AI 超級計(jì)算機(jī)用于科學(xué)研究及通過 Ozaki 仿真方法所帶來的諸多創(chuàng)新,這些都推動(dòng)著 Tensor Core 處理高精度計(jì)算的性能不斷提升,一個(gè)新時(shí)代正在到來。
從某些指標(biāo)來看,超級計(jì)算機(jī)將繼續(xù)提速,但僅有速度是不夠的。要找到破解重要科學(xué)難題的新見解,需要依賴智能、靈活的方法,以在不犧牲科學(xué)嚴(yán)謹(jǐn)性的前提下加速科學(xué)發(fā)現(xiàn),從而滿足科學(xué)和高性能計(jì)算社區(qū)乃至全球的需求。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5282瀏覽量
106019 -
超級計(jì)算機(jī)
+關(guān)注
關(guān)注
2文章
472瀏覽量
42401 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3932瀏覽量
93340 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
91瀏覽量
13629
原文標(biāo)題:NVIDIA 驅(qū)動(dòng)的現(xiàn)代超級計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Blue Lion超級計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行
NVIDIA技術(shù)賦能歐洲最快超級計(jì)算機(jī)JUPITER
NVIDIA助力全球最大量子研究超級計(jì)算機(jī)
NVIDIA GTC2025 亮點(diǎn) NVIDIA推出 DGX Spark個(gè)人AI計(jì)算機(jī)

NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)

NVIDIA推出個(gè)人AI超級計(jì)算機(jī)Project DIGITS
聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個(gè)人AI超級計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級芯片
云端超級計(jì)算機(jī)使用教程
NVIDIA加速全球大多數(shù)超級計(jì)算機(jī)推動(dòng)科技進(jìn)步

NVIDIA助力xAI打造全球最大AI超級計(jì)算機(jī)
NVIDIA Colossus超級計(jì)算機(jī)集群突破10萬顆Hopper GPU
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計(jì)算機(jī)

評論