性能提升20倍！NVIDIA A100 GPU打破16項AI芯片性能記錄

2020年7月30日，MLPerf組織發布第三個版本MLPerf Trainingv0.7基準測試（Benchmark）結果。結果顯示，英偉達基于今年5月最新發布的Ampere架構A100 TensorCore GPU，和HDR InfiniBand實現多個DGXA100系統互聯的龐大集群——DGX SuperPOD系統在性能上開創了八個全新里程碑，共打破16項紀錄。

MLPerf是成立于2018年5月的行業基準測試組織，致力于機器學習硬件、軟件和服務的訓練和推理性能測試，囊括行業中幾乎所有知名企業和機構，比如Intel、NVIDIA、Google、微軟、阿里巴巴等。

DGX SuperPOD系統公布于去年6月17號。最初由96臺NVIDIA DGX-2H超級計算機和Mellanox互連技術在短短三周內建成，提供9.4千兆次的處理能力，用于該公司在無人駕駛車輛部署計劃中的需求。

而此次創造紀錄的NVIDIA DGX SuperPOD系統主要基于Ampere架構以及Volta架構，并且搭載了今年5月份發布的Ampere架構GPU A100。

黃仁勛在GTC 2020大會上說道，A100是迄今為止人類制造出的最大7納米制程芯片。A100采用目前最先進的臺積電（TSMC）7納米工藝，擁有540億個晶體管，它是一塊3D堆疊芯片，面積高達826mm^2，GPU的最大功率達到了400W。

這塊GPU上搭載了容量40G的三星HBM2顯存（比DDR5速度還快得多，就是很貴），第三代TensorCore。同時它的并聯效率也有了巨大提升，其采用帶寬600GB/s的新版NVLink，幾乎達到了10倍PCIE互聯速度。

隨著安培架構出現的三代TensorCore對稀疏張量運算進行了特別加速：執行速度提高了一倍，也支持TF32、FP16、BFLOAT16、INT8和INT4等精度的加速——系統會自動將數據轉為TF32格式加速運算，現在你無需修改任何代碼量化了，直接自動訓練即可。

A100也針對云服務的虛擬化進行了升級，因為全新的multi-instanceGPU機制，在模擬實例時，每塊GPU的吞吐量增加了7倍。

最終在跑AI模型時，如果用PyTorch框架，相比上一代V100芯片，A100在BERT模型的訓練上性能提升6倍，BERT推斷時性能提升7倍。

電子發燒友綜合報道，參考自鎂客網、機器之心，轉載請注明來源和出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5194

瀏覽量
105517
gpu

gpu

+關注

關注
28

文章
4887

瀏覽量
130451

Carol Li
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內最值得關注的10家人工智能語音識別公司
Hot 思遠的十年：從創業之初兩個人，做到TWS耳機市場電源芯片市占第一

New 人形機器人關節核心零部件，諧波減速器的技術挑戰和創新發展趨勢
New 102.85Nm/kg扭矩密度突破！無框力矩電機如何定義人形機器人關節性能極限

精選推薦
更多

文章

資料

帖子

沐曦具身智能仿真生成系統方案

沐曦MetaX
12分鐘前

13 閱讀

448 Gbps多級脈沖幅度調制測試方案

是德科技KEYSIGHT
29分鐘前

50 閱讀

基于RK3576開發板的車輛檢測算法

ljx2016
16小時前

336 閱讀

基于RK3576開發板的安全帽檢測算法

ljx2016
17小時前

269 閱讀

智多晶eSPI_Slave IP介紹

智多晶
17小時前

214 閱讀

51系列模擬電子電路學習教程

liuxin
859 KB

免費

459下載

基于openharmony適配移植實現的氣泡視圖教程

姚小熊27
0.76 MB

免費

1下載

Green Recorder Linux簡易錄屏軟件

李丹
0.05 MB

2積分

3下載

LetuCRM銷售管理系統

馬祥
7.02 MB

免費

0下載

納米克隆開源資料分享

陳存樓
0.22 MB

免費

0下載

【RA-Eco-RA4M2開發板評測】RTC電子鐘

wang123a
1天前

290 閱讀

HarmonyOS NEXT應用開發-Notification Kit（用戶通知服務）notificationManager.getActiveNotifications

李洋水蛟龍
1天前

242 閱讀

經棧橋整流后光耦輸出異常，是什么原因？

jf_28522547
1天前

540 閱讀

如何計算集成斬波放大器的ADC失調誤差和輸入阻抗？

灑下墨色
1天前

493 閱讀

電路基礎知識最全匯總，看這一篇就夠了！（建議收藏）

yuu_cool
1天前

450 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

性能提升20倍！NVIDIA A100 GPU打破16項AI芯片性能記錄

評論