AMD在本周的SC20虛擬會(huì)議上,推出了基于他們CDNA架構(gòu)的AMD Instinct MI100加速器。另外值得注意的是,與MI100發(fā)布同時(shí)進(jìn)行的還有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本。A MD認(rèn)為MI100是世界上最快的HPC GPU加速器,提供超過10TFLOPS的FP64計(jì)算能力。MI100額定峰值FP64性能為11.5 TFLOPS,F(xiàn)P32矩陣性能高達(dá)46.1 TFLOPS。與上一代AMD加速器相比,搭配AMD矩陣核心技術(shù)的MI100在人工智能訓(xùn)練方面的FP16峰值性能提升近7倍。
AMD Instinct MI100內(nèi)建32GB HBM2內(nèi)存,工作頻率1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,內(nèi)建120個(gè)計(jì)算單元和7680個(gè)流處理器。CDNA是Vega架構(gòu)演化版本,而不是針對(duì)游戲優(yōu)化的RDNA/Navi架構(gòu),考慮到HPC的重點(diǎn)和我們看到Arcturus Linux補(bǔ)丁成熟的時(shí)間,AMD Instinct MI100支持的Linux支持應(yīng)該是很好的推出狀態(tài),盡管我們還沒能測(cè)試加速器以確認(rèn)其Linux支持狀態(tài)。
AMD Instinct MI100使用32GB HBM2內(nèi)存,時(shí)鐘速率為1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,可打包120個(gè)計(jì)算單元和7680個(gè)流處理器。CDNA是織女星結(jié)構(gòu)的進(jìn)化,而不是游戲優(yōu)化而不是計(jì)算的RDNA/Navi??紤]到AMD對(duì)HPC的關(guān)注以及Arcturus Linux補(bǔ)丁準(zhǔn)備在即,AMD Instinct MI100應(yīng)該很好的支持到Linux。
這次推出的ROCm 4.0讓它比以往更容易更高效地將NVIDIA CUDA代碼庫移植到它上面。ROCm 4.0被宣傳為 “Exascale時(shí)代 ”的開源平臺(tái),同時(shí)支持OpenMP 5.0行業(yè)標(biāo)準(zhǔn)及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm進(jìn)化目的是讓開發(fā)者更容易部署和移植他們的軟件,使其運(yùn)行在這個(gè)開源計(jì)算棧上,而不是NVIDIA專有的 CUDA平臺(tái)。
AMD還在SC20虛擬會(huì)議上表示,EPYC “Zen 3 ”處理器本季度將批量提供給部分HPC和云計(jì)算客戶。AMD EPYC Zen 3 CPU將在2021年第一季度正式發(fā)布和上市。
責(zé)任編輯:PSY
-
amd
+關(guān)注
關(guān)注
25文章
5586瀏覽量
136326 -
加速器
+關(guān)注
關(guān)注
2文章
827瀏覽量
39109 -
gpu
+關(guān)注
關(guān)注
28文章
4943瀏覽量
131209
發(fā)布評(píng)論請(qǐng)先 登錄
重磅!AMD將恢復(fù)向中國(guó)出口MI308芯片!
AMD將DeepSeek-V3模型集成至Instinct MI300X GPU
消息稱AMD Instinct MI400 AI加速器將配備8個(gè)計(jì)算芯片
AMD集成DeepSeek-V3模型至Instinct MI300X GPU
AMD MI300X AI芯片面臨挑戰(zhàn)
IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力
IBM將在云平臺(tái)部署AMD加速器
IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器
AMD發(fā)布新版Instinct MI325X
AMD發(fā)布新一代AI芯片MI325X
三星首度引入AMD MI300X,緩解AI GPU短缺
AMD Radeon Anti-Lag 2技術(shù)的功能特性
AMD Radeon Anti-Lag 2技術(shù)帶來低延遲游戲體驗(yàn)
簡(jiǎn)單認(rèn)識(shí)AMD Radeon RX 6750 GRE系列顯卡

AMD Radeon RX 7700 XT顯卡的主要特性

評(píng)論