在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達新一代GPU架構安培A100發布,實現高達20倍的性能提升

牽手一起夢 ? 來源:雷鋒網 ? 作者:包永剛 ? 2020-05-15 14:48 ? 次閱讀

突如其來的新冠肺炎大流行打亂了眾多公司的產品發布計劃,比如本該在今年3月英偉達(NVIDIA)GTC 2020上發布的安培(Ampere)架構曝光多次卻一直未發布。今天,英偉達CEO黃仁勛發布了英偉達新一代GPU架構安培,并帶來了基于安培架構GPU A100的DGX-A100 AI系統和面向邊緣AI計算的EGX A100。

有意思的是,受疫情影響,已經在家工作四十五天的黃仁勛是在家里的廚房提前錄制了演講視頻,用三個視頻完成了2020 GTC的主題演講和新品發布。

此次GTC 2020最重磅的產品自然是安培架構GPU A100,這是目前全球最大的7nm芯片,面積高達826平方毫米,集成了540億個晶體管。相比Volta架構實現了高達20倍的性能提升,并且可以同時滿足AI訓練和推理的需求。

由8個安培A100 GPU打造的NVIDIA DGX A100 AI系統單節點性能達到了創紀錄的5 petaflops。

第八代安培GPU架構性能提升高達20倍

安培是英偉達繼2018發布的Turing(圖靈)架構之后的最新一代GPU架構,也是英偉達推出的第八代GPU架構。黃仁勛說:“Ampere架構的突破性設計為英偉達第八代GPU提供了迄今為止最大的性能飛躍,集AI訓練和推理于一身,并且其性能相比于前代產品提升了高達20倍。這是有史以來首次,可以在一個平臺上實現對橫向擴展以及縱向擴展的負載的加速。A100將在提高吞吐量的同時,降低數據中心的成本。”

據悉,第八代安培架構GPU采用的是臺積電7nm工藝,使用的是最新的3D封裝技術,集成540億個晶體管也讓安培架構GPU A100成為了全球最大的7nm芯片。除此之外,A100還有另外四大關鍵特性:

具有TF32的第三代 Tensor Core核心,英偉達廣泛采用的 Tensor Core核心現在已變得更加靈活、快速且易于使用。

多實例GPU-MG,一種全新技術功能,可將單個A100GPU分割為多達七個獨立的GPU,為不同規模的工作提供不同的計算力,以此實現最佳利用率和投資回報率的最大化。

第三代 NVIDIA NVLInk,使GPU之間的高速聯接增加至原來的兩倍,實現服務器的高效性能擴展。

結構化稀疏,這種全新效率技術利用AI數學固有的稀疏性,使性能提升了一倍。

對于具有TF32的第三代Tensor Core核心,黃仁勛解釋,其功能經過擴展后加入了專為AI開發的全新TF32,它能在無需更改任何代碼的情況下,使FP32精度下的AI性能提高多達20倍。此外,TensorCore核心現在支持FP64精度,相比于前代,其為HPC應用所提供的計算力比之前提高了多達2.5倍。

20倍的提升之所以是對比2017年發布的Volta架構而不是2018年發布的圖靈架構,雷鋒網(公眾號:雷鋒網)認為主要是因為此前英偉達發布的兩代AI系統DGX-1和DGX-2都是基于Volta架構GPU Tesla V100,今天推出的基于安培架構的DGXA100是最新第三代AI系統,把兩者進行對比更有意義。

憑借這些新功能,英偉達A100能夠成為了AI訓練和推理以及科學模擬、對話式AI、推薦系統、基因組學、高性能數據分析、地震建模和金融預測等各種高要求工作負載的理想選擇。

不過,雷鋒網認為,靈活性是性能之外A100更重要的競爭力所在,這個靈活性包括三個層面,第一個層面是A100采用的彈性計算技術能夠為每項工作分配適量的計算能力,多實例GPU技術可將每個A100 GPU分割為多達七個獨立實例來執行推理任務。

第二個層面,第三代NVLink互聯技術能夠將多個A100 GPU合并成一個巨大的GPU來執行更大規模的訓練任務。

最后一個也是最重要的,安培架構的A100既可以做訓練也可以做推理。英偉達給出的數據顯示,A100對比前代Telsa V100,進行BERT模型訓練性能提升了6倍,BERT模型推理性能提升了7倍。

2017年發布Volta架構的時候,黃仁勛就說:“從 Volta 開始,英偉達 GPU 將對訓練、推理兼顧,可謂是革命性的突破。”三年后,他在很大程度上兌現了自己所說的,而這也能夠繼續保持英偉達在AI市場的領導力。

要把這個問題說清楚就得從最新推出的DGX A100說起。

DGX A100單節點性能達創紀錄的5 Petaflops

黃仁勛表示,“AI已經被應用到云計算、汽車、零售、醫療等眾多領域,AI算法也正變得越來越復雜和多樣。ResNet模型的算力需求從2016年到現在已經增加了3000倍,我們需要更好的解決方案。”

為此,英偉達推出了第三代AI系統DGX A100,高達5 Petaflops(每秒一千萬億(10的15次方)次浮點運算)的Al性能刷新的全球最高激勵,并且首次將整個數據中心的性能和功能集成到一個靈活的平臺中。

DGXA100系統集成了8個A100 Tensor Core GPU, 具有320GB內存用以訓練最大型的AI數據集,以及速度可達200Gbps MeLLanox HDR互連。

另外,利用A100的多實例GPU功能,每臺DGXA100系統能夠被分割為多達56個實例,用于加速多個小型工作負載的處理速度。憑借這些功能,企業可在一個完全集成的軟件定義平臺上根據自己的需求優化計算力和資源,加快數據分析、訓練和推理等各種工作負載的速度。

總結起來,DGX A100有6大技術特性:

8 個 NVIDIA A100 TensorCore GPU, Al 性能達 5PetafLops, GPU 內存共 320GB ,有著每秒 12.4TB的帶寬。

6 個采用第三代NVIDIA NVLink技術的NVIDIA NVSwitch互聯結構,4.8TB每秒的雙向帶寬

9個 MeLLanox ConnectX-6 HDR 200Gb/s網絡接口,提供總計每秒3.6TB的雙向帶寬。 MeLLanox網絡計算和網絡加速引擎,例如RDMA、GPUDirect,以 及SHARP技術,實現最高性能和可擴展性。

15TB Gen4 NVMe 內存,速度比 Gen3 NVMe SSDs 快 2 倍。

NVIDIA DGX軟件堆棧,其中包括專為AI和數據科學工作負載而優化的軟件,能夠實現性 能的最大化,使企業能夠更快獲得AI基礎架構投資回報。

DGX A100系統的起售價為19.9萬美元,英偉達已經開始銷售DGXA100。19.9萬美元看起來十分昂貴,但其實可以為云服務提供商降低成本和功耗,這是云服務提供商的痛點。

黃仁勛說,通過一個價值100萬美元由5個DGX A100系統組成的機架,可以取代當下價值1100萬美元,由50個DGX-1和600個CPU組成的25個機架AI訓練和推理的數據中心。并且,功耗也可以由630kW大幅降低至28kW。

也就是說,5個DGXA100組成的系統,實現相同的性能,耗電量為現有數據中心系統的1/20,空間為1/25,成本為1/10。

據悉,DGXA100的首批訂單將送往美國能源部的阿貢國家實驗室(Argonne National Laboratory),該實驗室將運用該集群的Al和計算力來更好地研究和應對新冠肺炎。

更厲害的是,英偉達還展示了新一代DGXSuper POD,這個集群由140臺 DGXA100系統組成,AI算力高達700 Petaflops,利用 MeLLanox HDR 200Gbps InfiniBand 互連技術,NVIDIA 將 140 臺 DGX A100 系統結合在一起,構建了 DGXSuper POD AI超級計算機,用于內部對話式AI、基因組學和自動 駕駛等領域的研究。

黃仁勛稱,DGXSuper POD集群是全球速度最快的AI超級計算機之一,其性能相當于此前數千臺服務器的性能。憑借DGXA100的企業就緒型架構和性能,NVIDIA得以在不到一個月的時間內構建了該系統,而以往交付具備這樣能力的超級計算機需要花費數月甚至數年的時間來計劃和采購專用的組件。

另外,為幫助客戶構建他們自己的由A100提供算力的數據中心,英偉達發布了全新DGX Super POD參考架構。還推出了 NVIDIA DGXpert計劃 , 幫助DGX客戶與英偉達的Al專家建立聯系。同時,英偉達還推出DGX-Ready軟件計劃,幫助用戶在AI工作流程中充分利用各種經過認證的企業級軟件。

更高性價比,更具靈活性的DGXA100對于全球的云服務提供商以及研究機構顯然都很有吸引力,同樣基于A100的EGXA100也同樣如此。

兩款邊緣AI平臺擴大生態系統

面向邊緣AI市場,英偉達此次GTC 2020推出了兩款計算平臺,分別是適用于較大型商業通用服務器上的EGX A100和適用于微型邊緣服務器的微型EGX Jetson Xavier NX 。

黃仁勛介紹說,EGXA100聚合加速器和EGX Jetson Xavier NX微型邊緣服務器分別被設計用于滿足不同尺寸、成本和性能需求。例如搭載了EGX A100的服務器可以管理機場中的數百臺攝像頭,而 EGX Jetson Xavier NX則可用于管理便利店中的少量攝像頭。而云原生技術支持能夠確保整個EGX產品家族都可以使用同一經過優化的AI軟件輕松構建和部署AI應用。

其中,EGXA100是基于安培架構的A100 GPU,借助英偉達的MeLLanox ConnectX-6 Dx板載網卡,EGXA100可以每秒接收高達200 Gb的數據并將其直接發送到GPU內存以進行AI或 5G信號處理。

EGXA100作為一個云原生軟件定義加速器,可以處理對延遲最敏感的5G應用,這為在一個行動點(如:商店、醫院和工廠車間)做出智能實時決策提供了局性能AI和 5G平臺。

EGX Jetson Xavier NX沒有采用最新GPU,不過英偉達稱其為全球體積最小、性能最強大的Al超級計算機,適用于微型服務器和邊緣智能物聯網盒。

據悉,在EGX Jetson Xavier NX的生態圈內,合作伙伴已提供了超過20種解決方案。可以將英偉達Xavier SoC的性能整合到了一個信用卡大小的模塊中,運行 EGX云原生軟件堆棧的EGX Jetson Xavier NX可以快速處理來自多個高分辨率傳感器的流式數據。

值得一提的是,EGX邊緣AI平臺的云原生架構使其可以運行容器化的軟件,英偉達應用框架包括了用于醫療領域的Clara、用于電信領域的Aerial、用于對話式AI領域的Jarvis、用于機器人技術領域的Isaac, 以及用于零售、智慧城市、交通等領域的Mertopolis。

目前整個EGX產品家族均支持云原生技術,因此智能機器制造商和AI應用開發者們可以在嵌入式及邊緣設備上構建和部署針對機器人技術、智慧城市、醫療、工業物聯網等領域的的軟件定義功能。

雷鋒網小結

三年前的5月,黃仁勛發布了Volta架構的Tesla V100 GPU,并推出了基于它的AI系統DGX-1。今天,由于新冠肺炎疫情的影響,本來計劃在三月發布的最新一代安培架構推遲到了5月。基于安培架構的首款GPU A100是全球最大的7nm芯片,性能相比Volta架構提升最高可以達到20倍,一個架構就可以同時應用于云端和邊緣端。

更為重要的是,基于A100的DGXA100 AI系統能夠幫助云服務提供商大幅降低數據中心的硬件采購成本和電費支出(這是數據中心的重要支出)。同樣基于A100的EGXA100邊緣計算平臺能夠將AI應用于更多的AI場景以及已經開始商用的5G市場。

這種架構的靈活性以及產品的靈活組合,能夠讓英偉達昂貴的GPU有高的性價比,而安培架構更好實現訓練和推理性能的提升,也更有助于英偉達打造云端和邊緣端一體化的AI產品,保持在AI市場的競爭力。

可以看到,在云端市場英偉達用安培架構GPU同時滿足訓練和推理需求,這將在云端AI推理芯片市場占有優勢的英特爾帶來更大的競爭壓力,而想要挑戰云端芯片市場的AI芯片的初創公司難度也進一步升級。在邊緣市場,英偉達用高性能、多產品組合去滿足市場豐富的應用需求,持續開拓生態,要將云端的優勢拓展至邊緣端。

這樣看來,已經在數據中心、汽車、醫療AI市場都有優勢的英偉達,還正在與開源社區合作為Apache Spark 3.0帶來端到端的GPU加速,正進一步向AI市場發起了全面的攻勢。這是否意味著英偉達離AI產品收入高于游戲顯卡收入的時代也不遠了?

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4912

    瀏覽量

    130677
  • AI
    AI
    +關注

    關注

    87

    文章

    34291

    瀏覽量

    275471
  • 英偉達
    +關注

    關注

    22

    文章

    3922

    瀏覽量

    93136
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    英偉擬再推中國特供GPU,今年6月量產!

    。 ??????????????????????????????????????????????????? 最新消息顯示,英偉擬新推出款專門面向中國市場的人工智能芯片,且最早將于今年6月開始量產。這款芯片屬于
    發表于 05-27 00:03 ?4283次閱讀

    英偉Q3將發布新一代人工智能系統

    的電氣機械,但是確是全面升級的,GB300 升級到了 Grace Blackwell Ultra 架構,而且推理性能、HBM 內存容量、網絡性能
    的頭像 發表于 05-19 18:02 ?275次閱讀

    GPU 維修干貨 | 英偉 GPU H100 常見故障有哪些?

    上漲,英偉H100GPU憑借其強大的算力,成為AI訓練、高性能計算領域的核心硬件。然而,隨著使用場景的復雜化,H100服務器故障率也逐漸攀
    的頭像 發表于 05-05 09:03 ?412次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>GPU</b> H<b class='flag-5'>100</b> 常見故障有哪些?

    Nordic新一代旗艦芯片nRF54H20深度解析

    、芯片概覽:第四多協議SoC的革新 Nordic Semiconductor最新發布的??nRF54H20??作為nRF54H系列首款SoC,標志著低功耗無線技術的又
    發表于 04-26 23:25

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    宣布在英偉 Grace Blackwell 平臺上實現高達 30 的預期性能
    發表于 03-19 17:59 ?219次閱讀

    寶馬發布新一代智能電子電氣架構

    "超級大腦"賦能寶馬新世代車型智能駕駛樂趣 全新一代電子電氣架構搭載新世代車型,覆蓋全動力系統和全細分車型 全新一代電子電氣架構集成算力提升
    的頭像 發表于 03-13 15:42 ?250次閱讀

    英偉A100和H100比較

    英偉A100和H100都是針對高性能計算和人工智能任務設計的GPU,但在
    的頭像 發表于 02-10 17:05 ?3552次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比較

    芯原發布新一代Vitality架構GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構的圖形處理器(GPU)IP系列。這一新一代GPU架構以其卓越的計算
    的頭像 發表于 12-24 10:55 ?823次閱讀

    芯原推出新一代性能Vitality架構GPU IP系列

    新一代Vitality GPU架構顯著提升了計算性能,并支持多核擴展,以進
    的頭像 發表于 12-19 15:55 ?431次閱讀

    英偉新一代AI芯片過熱問題引關注

    近日,英偉新一代Blackwell AI芯片遭遇過熱問題,這消息引發了業界的廣泛關注。據悉,搭載該芯片的服務器在運行過程中存在過熱現象,可能影響其正常交付,這令谷歌、微軟等潛在客戶
    的頭像 發表于 11-19 16:15 ?582次閱讀

    英偉推出歸化Transformer,革命性提升LLM訓練速度

    了新的突破。 相較于傳統的Transformer架構,nGPT在保持原有精度的同時,直接將大型語言模型(LLM)的訓練速度提升高達20
    的頭像 發表于 10-23 11:30 ?773次閱讀

    英偉Blackwell GPU量產加速,Q4營收沖刺百億美元大關

    近日,全球領先的圖形處理單元(GPU)及人工智能芯片制造商英偉傳來重大利好消息。據摩根士丹利最新發布的行業分析報告指出,英偉
    的頭像 發表于 09-26 15:58 ?575次閱讀

    英偉或取消B100轉用B200A代替

    今年3月份,英偉在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構GPU。原定于今年底出貨的B100
    的頭像 發表于 08-08 17:19 ?851次閱讀

    Flow Computing引領CPU性能革命:PPU技術實現性能提升

    在科技日新月異的今天,芬蘭的家科技初創公司Flow Computing以其革命性的技術突破,再次讓全球科技界為之震撼。近日,該公司宣布其研發的并行處理單元(PPU)成功實現了對任何CPU架構
    的頭像 發表于 06-14 14:34 ?1722次閱讀

    英偉GPU新品規劃與HBM市場展望

    在COMPUTEX 2024主題演講中,英偉(NVIDIA)公布了其GPU產品的未來規劃。據英偉透露,B
    的頭像 發表于 06-13 09:44 ?1213次閱讀
    主站蜘蛛池模板: 69国产成人综合久久精品 | 色花堂国产精品首页第一页 | 色花堂国产精品首页第一页 | 91网站免费在线观看 | 欧美18同性gay视频 | 欧美一区二区影院 | 天天操天天碰 | 99国产成人精品2021 | 亚洲播播 | 日韩porn| 免费一级欧美片在线观免看 | 国产成人av在线 | 高清毛片一区二区三区 | 很黄很污的视频网站 | 五月天天爱 | 一级特级女人18毛片免费视频 | 狂野欧美性色xo影院 | 欧美资源在线观看 | 国产高清一区二区 | 天天插日日射 | 美女扒开尿口给男人捅 | 国产美女一区 | 美女丝袜长腿喷水gif动态图 | 欧美一区精品 | 天堂在线视频网站 | 天堂资源在线8 | 国产亚洲新品一区二区 | 久久综合九色综合精品 | www.av毛片| 同性恋激情视频 | 99热最新网址 | 国产三级香港三级人妇 | 女人牲交一级毛片 | 国产精品女人在线观看 | 丁香色婷婷 | 亚洲成a人不卡在线观看 | 国产精品99r8免费视频2022 | 久久精品亚洲一区二区三区浴池 | 禁网站在线观看免费视频 | 色妇影院 | 黄网站色视频 |