超級芯片架構上的庫可將計算工程工具的運算速度提升至原來的 11 倍,并可處理計算規模達 5 倍的任務。
借助由 NVIDIA 超級芯片提供支持的NVIDIA CUDA-X庫,各類科學家和工程師能夠更快地解決棘手問題。
NVIDIA GTC 全球 AI 大會上宣布,開發者現在可以通過 CUDA-X 與新一代超級芯片架構的協同,實現 CPU 和 GPU 資源間深度自動化整合與調度,相較于傳統加速計算架構,該技術可使計算工程工具運行速度提升至原來的 11 倍,計算規模增加至 5 倍。
這極大地加速并改進了工程模擬、設計優化等方面的工作流程,幫助科學家和研究人員更快地取得突破性成果。
NVIDIA 于 2006 年推出了 CUDA,開啟了加速計算的應用新紀元。歷經多年發展,NVIDIA 已經構建了 900 多個專業領域的 NVIDIA CUDA-X 庫和 AI 模型,推動加速計算的應用,并催生多項重大的科學突破。如今,CUDA-X 將加速計算拓展至一系列新的工程領域,包括天文學、粒子物理學、量子物理學、汽車、航空航天及半導體設計。
NVIDIA Grace CPU 架構可顯著提升顯存帶寬,同時降低功耗。NVIDIANVLink-C2C互連技術可提供超高帶寬,使 GPU 和 CPU 能夠共享存儲單元,從而讓開發者簡化專用代碼編寫、處理更大規模的計算任務,并提高應用性能。
借助 NVIDIA cuDSS 加速工程求解器
NVIDIA 的超級芯片架構使用戶能夠更高效地利用 CPU 和 GPU 處理能力,從而可以從相同的底層 GPU 中獲得更高的性能。
NVIDIA cuDSS庫專為解決涉及稀疏矩陣的大型工程模擬問題而設計,可廣泛用于設計優化、電磁模擬工作流程等應用。cuDSS 通過 Grace GPU 顯存與高帶寬 NVLink-C2C 互連技術,實現對超出設備顯存容量限制的大型矩陣的分解和求解,從而使用戶能夠在極短時間內解決極其龐大的問題。
GPU 和 Grace GPU 之間的一致共享存儲單元可最大限度地減少數據遷移,從而顯著降低大型系統的運行開銷。對于各類大規模計算工程問題,通過 Grace CPU 存儲單元和超級芯片架構,在相同 GPU 和 cuDSS 混合顯存技術下,可將最耗時的求解環節速度提升至原來的 4 倍。
Ansys 已將 cuDSS 集成到其 HFSS 求解器中,顯著增強了電磁模擬的性能。借助 cuDSS,HFSS 軟件可將矩陣求解器速度提升至原來的 11 倍。
Altair OptiStruct 采用了 cuDSS Direct Sparse Solver 庫,極大加速了其有限元分析的工作負載。
這些性能的提升是通過優化 GPU 上的關鍵操作,同時智能地使用 CPU 進行共享存儲單元以及異構 CPU 和 GPU 執行來實現的。cuDSS 可自動檢測利用 CPU 能提供額外優勢的區域,從而進一步提高效率。
借助超級芯片顯存以超快速度進行擴展
NVLink-CNC 互聯技術可提供 CPU 和 GPU 之間的顯存一致性,從而在單個 GPU 上擴展顯存受限的應用程序。
許多工程模擬都受到規模的限制,需要進行大量模擬才能生成設計包含復雜組件(如飛機引擎)的設備所需的分辨率。通過利用在 CPU 和 GPU 顯存之間無縫讀寫的能力,工程師可以輕松實現核外求解器來處理更大的數據。
NVIDIA cuQuantum 助力量子計算研究
量子計算機有望加速解決許多科學和工業學科的核心問題。縮短有用量子計算的時間,很大程度上取決于模擬極其復雜的量子系統的能力。
模擬使研究人員能夠在當下開發新算法,以適應未來的量子計算機規模。此外,它們還在優化量子處理器、運行復雜的性能仿真,以及新量子比特設計的噪聲特性方面發揮著關鍵作用。
量子算法的所謂狀態向量模擬需要對存儲在顯存中的指數級大規模向量執行矩陣運算。而張量網絡模擬則通過張量收縮來模擬量子算法,對于特定重要類別的應用,能夠實現成百上千個量子比特的模擬規模。
NVIDIA cuQuantum庫可加速這些工作負載。cuQuantum 與每個領先的量子計算框架集成,因此所有量子研究人員都可以在不更改代碼的情況下利用模擬性能。
-
NVIDIA
+關注
關注
14文章
5160瀏覽量
104895 -
gpu
+關注
關注
28文章
4848瀏覽量
129981 -
AI
+關注
關注
87文章
32921瀏覽量
272555 -
超級芯片
+關注
關注
0文章
37瀏覽量
8975
原文標題:GTC25 | NVIDIA 借助由超級芯片提供支持的 CUDA-X 庫加速科學和工程發展
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Cadence 利用 NVIDIA Grace Blackwell 加速AI驅動的工程設計和科學應用
英偉達GTC2025亮點:NVIDIA Blackwell加速計算機輔助工程軟件,實現實時數字孿生性能數量級提升
Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

《CST Studio Suite 2024 GPU加速計算指南》
NVIDIA將在越南開設首個研發中心以推動AI發展
NVIDIA加速全球大多數超級計算機推動科技進步

借助NVIDIA DOCA 2.7增強AI 云數據中心和NVIDIA Spectrum-X
借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

評論