在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA HGX H100加速計(jì)算數(shù)據(jù)中心平臺(tái)應(yīng)用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:William Tsu ? 2022-04-20 10:54 ? 次閱讀

NVIDIA 的使命是加快我們的時(shí)代達(dá)芬奇和愛因斯坦的工作,并賦予他們解決社會(huì)的巨大挑戰(zhàn)。隨著 人工智能AI )、 高性能計(jì)算 ( HPC )和數(shù)據(jù)分析的復(fù)雜性呈指數(shù)級(jí)增長,科學(xué)家需要一個(gè)先進(jìn)的計(jì)算平臺(tái),能夠在一個(gè)十年內(nèi)實(shí)現(xiàn)百萬次的加速,以解決這些非同尋常的挑戰(zhàn)。

為了回答這個(gè)需求,我們介紹了NVIDIA HGX H100 ,一個(gè)由 NVIDIA Hopper 架構(gòu) 供電的密鑰 GPU 服務(wù)器構(gòu)建塊。這一最先進(jìn)的平臺(tái)安全地提供了低延遲的高性能,并集成了從網(wǎng)絡(luò)到數(shù)據(jù)中心級(jí)計(jì)算(新的計(jì)算單元)的全套功能。

在這篇文章中,我將討論NVIDIA HGX H100 是如何幫助我們加速計(jì)算數(shù)據(jù)中心平臺(tái)的下一個(gè)巨大飛躍。

HGX H100 8-GPU

HGX H100 8- GPU 是新一代 Hopper GPU 服務(wù)器的關(guān)鍵組成部分。它擁有八個(gè) H100 張量核 GPU 和四個(gè)第三代 NV 交換機(jī)。每個(gè) H100 GPU 都有多個(gè)第四代 NVLink 端口,并連接到所有四個(gè) NVLink 交換機(jī)。每個(gè) NVSwitch 都是一個(gè)完全無阻塞的交換機(jī),完全連接所有八個(gè) H100 Tensor Core GPU 。

The HGX H100 8-GPU represents the key building block of the new Hopper generation GPU server and hosts eight H100 Tensor Core GPUs and four third generation NVSwitch.

圖 1 。 HGX H100 8-GPU 的高級(jí)框圖

NVSwitch 的這種完全連接的拓?fù)浣Y(jié)構(gòu)使任何 H100 都可以同時(shí)與任何其他 H100 通話。值得注意的是,這種通信以每秒 900 千兆字節(jié)( GB / s )的 NVLink 雙向速度運(yùn)行,這是當(dāng)前 PCIe Gen4 x16 總線帶寬的 14 倍多。

第三代 NVSwitch 還為集體運(yùn)營提供了新的硬件加速,多播和 NVIDIA 的網(wǎng)絡(luò)規(guī)模大幅縮減。結(jié)合更快的 NVLink 速度,像all-reduce這樣的普通人工智能集體操作的有效帶寬比 HGX A100 增加了 3 倍。集體的 NVSwitch 加速也顯著降低了 GPU 上的負(fù)載。

表 1 。將 HGX A100 8- GPU 與新的 HGX H100 8-GPU 進(jìn)行比較

*注: FP 性能包括稀疏性

HGX H100 8- GPU 支持 NVLink 網(wǎng)絡(luò)

新興的 exascale HPC 和萬億參數(shù)人工智能模型(用于精確對(duì)話人工智能等任務(wù))需要數(shù)月的訓(xùn)練,即使是在超級(jí)計(jì)算機(jī)上。將其壓縮到業(yè)務(wù)速度并在數(shù)小時(shí)內(nèi)完成培訓(xùn)需要服務(wù)器集群中每個(gè) GPU 之間的高速、無縫通信。

為了解決這些大的使用案例,新的 NVLink 和 NVSwitch 旨在使 HGX H100 8- GPU 能夠通過新的 NVLink 網(wǎng)絡(luò)擴(kuò)展并支持更大的 NVLink 域。 HGX H100 8- GPU 的另一個(gè)版本具有這種新的 NVLink 網(wǎng)絡(luò)支持。

The HGX H100 8-GPU was designed to scale up to support a larger NVLink domain with the new NVLink-Network.

圖 2 。支持 NVLink 網(wǎng)絡(luò)的 HGX H100 8- GPU 的高級(jí)框圖

使用 HGX H100 8- GPU 和 NVLink 網(wǎng)絡(luò)支持構(gòu)建的系統(tǒng)節(jié)點(diǎn)可以通過八進(jìn)制小尺寸可插拔( OSFP ) LinkX 電纜和新的外部 NVLink 交換機(jī)完全連接到其他系統(tǒng)。此連接最多支持 256 個(gè) GPU NVLink 域。圖 3 顯示了集群拓?fù)洹?/p>

表 2 。比較 256 個(gè) A100 GPU 吊艙和 256 個(gè) H100 GPU 吊艙

*注: FP 性能包括稀疏性

目標(biāo)用例和性能優(yōu)勢(shì)

隨著 HGX H100 計(jì)算和網(wǎng)絡(luò)能力的大幅增加, AI 和 HPC 應(yīng)用程序的性能得到了極大的提高。

今天的主流 AI 和 HPC 模型可以完全駐留在單個(gè)節(jié)點(diǎn)的聚合 GPU 內(nèi)存中。例如, BERT -Large 、 Mask R-CNN 和 HGX H100 是最高效的培訓(xùn)解決方案。

對(duì)于更先進(jìn)、更大的 AI 和 HPC 模型,該模型需要多個(gè)聚合 GPU 內(nèi)存節(jié)點(diǎn)才能適應(yīng)。例如,具有 TB 級(jí)嵌入式表的深度學(xué)習(xí)推薦模型( DLRM )、大量混合專家( MoE )自然語言處理模型,以及具有 NVLink 網(wǎng)絡(luò)的 HGX H100 加速了關(guān)鍵通信瓶頸,是此類工作負(fù)載的最佳解決方案。

圖 4 來自 NVIDIA H100 GPU 體系結(jié)構(gòu) 白皮書顯示了 NVLink 網(wǎng)絡(luò)帶來的額外性能提升。

所有性能數(shù)據(jù)都是基于當(dāng)前預(yù)期的初步數(shù)據(jù),可能會(huì)隨著運(yùn)輸產(chǎn)品的變化而變化。 A100 集群: HDR IB 網(wǎng)絡(luò)。 H100 集群: NDR IB 網(wǎng)絡(luò)和 NVLink 網(wǎng)絡(luò),如圖所示。

# GPU :氣候建模 1K , LQCD 1K ,基因組學(xué) 8 , 3D-FFT 256 , MT-NLG 32 (批次大小: A100 為 4 , 1 秒 H100 為 60 , A100 為 8 , 1.5 和 2 秒 H100 為 64 ), MRCNN 8 (批次 32 ), GPT-3 16B 512 (批次 256 ), DLRM 128 (批次 64K ), GPT-3 16K (批次 512 ), MoE 8K (批次 512 ,每個(gè) GPU 一名專家)?

HGX H100 4-GPU

除了 8- GPU 版本外, HGX 系列還具有一個(gè) 4-GPU 版本,該版本直接與第四代 NVLink 連接。

H100 對(duì) H100 點(diǎn)對(duì)點(diǎn)對(duì)等 NVLink 帶寬為 300 GB / s 雙向,比今天的 PCIe Gen4 x16 總線快約 5 倍。

HGX H100 4- GPU 外形經(jīng)過優(yōu)化,可用于密集 HPC 部署:

多個(gè) HGX H100 4- GPU 可以裝在 1U 高液體冷卻系統(tǒng)中,以最大化每個(gè)機(jī)架的 GPU 密度。

帶有 HGX H100 4- GPU 的完全無 PCIe 交換機(jī)架構(gòu)直接連接到 CPU ,降低了系統(tǒng)材料清單并節(jié)省了電源

對(duì)于 CPU 更密集的工作負(fù)載, HGX H100 4- GPU 可以與兩個(gè) CPU 插槽配對(duì),以提高 CPU 與 GPU 的比率,從而實(shí)現(xiàn)更平衡的系統(tǒng)配置。

人工智能和高性能計(jì)算的加速服務(wù)器平臺(tái)

NVIDIA 正與我們的生態(tài)系統(tǒng)密切合作,在今年晚些時(shí)候?qū)⒒?HGX H100 的服務(wù)器平臺(tái)推向市場(chǎng)。我們期待著把這個(gè)強(qiáng)大的計(jì)算工具交給你們,使你們能夠以人類歷史上最快的速度創(chuàng)新和完成你們一生的工作。

關(guān)于作者

William Tsu NVIDIA HGX 數(shù)據(jù)中心產(chǎn)品線的產(chǎn)品管理。他與客戶和合作伙伴合作,將世界上性能最高的人工智能、深度學(xué)習(xí)和 HPC 服務(wù)器平臺(tái)推向市場(chǎng)。威廉最初加入NVIDIA 是作為一名圖形處理器芯片設(shè)計(jì)師。他是最初的 PCI Express 行業(yè)標(biāo)準(zhǔn)規(guī)范的共同作者,也是 12 項(xiàng)專利的共同發(fā)明人。威廉獲得了他的學(xué)士學(xué)位,碩士學(xué)位在計(jì)算機(jī)科學(xué)和 MBA 從加利福尼亞大學(xué),伯克利。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5258

    瀏覽量

    105855
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5166

    瀏覽量

    73243
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48786

    瀏覽量

    246897
  • H100
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    391
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案

    全球領(lǐng)先的電子制造商正在利用 NVIDIA 技術(shù),構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案。
    的頭像 發(fā)表于 05-22 09:50 ?223次閱讀

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    數(shù)據(jù)中心依賴數(shù)千甚至上萬個(gè)GPU集群進(jìn)行高性能計(jì)算,對(duì)帶寬、延遲和數(shù)據(jù)交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺(tái),為多租戶環(huán)境提供推理服務(wù)。這類
    發(fā)表于 03-25 17:35

    英偉達(dá)A100H100比較

    英偉達(dá)A100H100都是針對(duì)高性能計(jì)算和人工智能任務(wù)設(shè)計(jì)的GPU,但在性能和特性上存在顯著差異。以下是對(duì)這兩款GPU的比較: 1. 架構(gòu)與核心規(guī)格: A100: 架構(gòu): 基于Amp
    的頭像 發(fā)表于 02-10 17:05 ?3652次閱讀
    英偉達(dá)A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比較

    利用NVIDIA DPF引領(lǐng)DPU加速計(jì)算的未來

    越來越多的企業(yè)開始采用加速計(jì)算,從而滿足生成式 AI、5G 電信和主權(quán)云的需求。NVIDIA 推出了 DOCA 平臺(tái)框架(DPF),該框架提供了基礎(chǔ)構(gòu)建模塊來釋放
    的頭像 發(fā)表于 01-24 09:29 ?612次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> DPF引領(lǐng)DPU<b class='flag-5'>加速</b>云<b class='flag-5'>計(jì)算</b>的未來

    NIDA發(fā)布《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》

    Alliance,以下簡稱 “NIDA”)攜手中國信息通信研究院等9家組織成員共同發(fā)布了《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》(以下簡稱 “技術(shù)要求”)。該技術(shù)要求明確了智算場(chǎng)景下數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)的技術(shù)要求與執(zhí)行標(biāo)準(zhǔn),旨在加速企業(yè)智
    的頭像 發(fā)表于 12-04 11:13 ?780次閱讀

    NVIDIA DOCA 2.9版本的亮點(diǎn)解析

    NVIDIA DOCA通過為開發(fā)者提供全面的軟件框架以利用硬件加速來增強(qiáng) NVIDIA 網(wǎng)絡(luò)平臺(tái)的功能,從而提高性能、安全性和效率。其 AP
    的頭像 發(fā)表于 11-27 11:15 ?766次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 2.9版本的亮點(diǎn)解析

    Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

    機(jī)架中的NVIDIA HGX B200 8-GPU系統(tǒng)數(shù)量,與Supermicro目前領(lǐng)先業(yè)界的搭載NVIDIA HGX H100
    發(fā)表于 11-25 10:39 ?734次閱讀
    Supermicro推出直接液冷優(yōu)化的<b class='flag-5'>NVIDIA</b> Blackwell解決方案

    華為致力于打造安全可靠的智算數(shù)據(jù)中心

    數(shù)據(jù)中心能源產(chǎn)品與解決方案亮相盛會(huì),同時(shí),華為數(shù)字能源數(shù)據(jù)中心能源及關(guān)鍵供電產(chǎn)品線副總裁陽必飛受邀參與此次盛會(huì),并發(fā)表《智算數(shù)據(jù)中心建設(shè)之道》主題演講。 ? 站在AI時(shí)代、智算中心發(fā)展
    的頭像 發(fā)表于 11-23 14:05 ?642次閱讀

    NVIDIA向開放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)
    的頭像 發(fā)表于 11-19 15:30 ?566次閱讀

    華迅光通AI計(jì)算加速800G光模塊部署

    400G光模塊。更多信息可以在這篇文章中找到:NVIDIA DGX H100簡介。這表明在葉脊架構(gòu)下,數(shù)據(jù)中心對(duì)高速光模塊的需求呈指數(shù)級(jí)增長。隨著數(shù)據(jù)中心規(guī)模的擴(kuò)大,特別是對(duì)AI大型模
    發(fā)表于 11-13 10:16

    英偉達(dá)H100芯片市場(chǎng)降溫

    隨著英偉達(dá)新一代AI芯片GB200需求的不斷攀升,其上一代明星產(chǎn)品H100芯片卻遭遇了市場(chǎng)的冷落。據(jù)業(yè)內(nèi)人士透露,搭載H100的服務(wù)器通常以8卡的形式進(jìn)行出售或出租,而在去年,這類服務(wù)器的售價(jià)普遍
    的頭像 發(fā)表于 10-28 15:42 ?1474次閱讀

    計(jì)算數(shù)據(jù)中心的關(guān)系

    計(jì)算數(shù)據(jù)中心之間存在著密切且復(fù)雜的關(guān)系,它們相互依存、互相促進(jìn)。 一、數(shù)據(jù)中心是云計(jì)算的基礎(chǔ)設(shè)施 數(shù)據(jù)中心是一整套復(fù)雜的設(shè)施,用于傳遞、
    的頭像 發(fā)表于 10-24 16:15 ?1382次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫,是支持復(fù)雜計(jì)算
    的頭像 發(fā)表于 09-09 09:57 ?781次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark<b class='flag-5'>平臺(tái)</b>提升<b class='flag-5'>計(jì)算</b>性能

    NVIDIA 在 Hot Chips 大會(huì)展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    、在處理器及系統(tǒng)架構(gòu)師領(lǐng)域的深度技術(shù)盛會(huì),Hot Chips 已經(jīng)成為價(jià)值萬億美元的數(shù)據(jù)中心計(jì)算市場(chǎng)的一個(gè)重要論壇。 在本周舉行的 Hot Chips 2024 上,NVIDIA 的高級(jí)工程師們展示了
    的頭像 發(fā)表于 08-28 16:38 ?605次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大會(huì)展示提升<b class='flag-5'>數(shù)據(jù)中心</b>性能和能效的創(chuàng)新技術(shù)

    SK電訊將與Lambda合作打造AI數(shù)據(jù)中心

    韓國領(lǐng)先的電信巨頭SK電訊(SK Telecom)宣布了一項(xiàng)重要合作計(jì)劃,將與美國知名的云GPU服務(wù)提供商Lambda攜手,于2024年12月在首爾共同推出一個(gè)先進(jìn)的人工智能(AI)數(shù)據(jù)中心。該中心將依托英偉達(dá)最新一代的H100
    的頭像 發(fā)表于 08-23 17:29 ?1547次閱讀
    主站蜘蛛池模板: 2019天天干天天操 | 免费啪啪网站 | 欧美黄色片免费看 | 伊人色强在线网 | 午夜看片影院在线观看 | 国产小视频免费观看 | 一区免费视频 | 天天操操操操操操 | 深爱激情小说网 | 日韩一级片免费在线观看 | 国内精品视频在线 | 国产色婷婷精品综合在线手机播放 | 国产做a爰片久久毛片a | 一区二区三区影院 | 国产精品三级在线 | 天天干狠狠插 | 我要看18毛片 | 99久久精品免费观看国产 | 色婷婷久久合月综 | www.91久久| 日本不卡视频在线观看 | 国产清纯白嫩大学生正在播放 | you ji z z日本人在线观看 | 色多多在线 | 1v1高h肉爽文bl | 一级骚片超级骚在线观看 | 色视频网站在线观看 | 寄宿日记免费看 | 成人午夜啪啪免费网站 | 天天综合亚洲 | 亚洲三级电影 | 午夜视频在线观看免费观看在线观看 | 男女性接交无遮挡免费看视频 | 国产伦精一区二区三区 | 草久久久久| 日欧毛片| 免费一看一级毛片全播放 | 中文字幕一区二区在线观看 | 奇米影视四色首页手机在线 | 一区二区中文字幕亚洲精品 | 欧美日韩视频综合一区无弹窗 |