91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析

向上 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2025-03-20 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

黃仁勛在GTC大會(huì)上的第一個(gè)大招是Blackwell Ultra——NVIDIA要把AI算力打成“白菜價(jià)”;

1.1 ExaFLOPS算力:相當(dāng)于1.3億部iPhone同時(shí)運(yùn)行ChatGPT;

20TB海量?jī)?nèi)存:裝下整個(gè)維基百科英文版400次;

推理成本暴降:訓(xùn)練GPT-5的耗電量感覺(jué)是一下從“開(kāi)勞斯萊斯”降到“坐地鐵”。

對(duì)比數(shù)據(jù)更扎心:用Blackwell訓(xùn)練大模型,速度比前代快1.5倍,能耗僅為1/3。

  1. ?Blackwell Ultra(GB300/B300)系列芯片
    • 采用液冷與硅光子技術(shù),單芯片集成 ?288GB HBM3e 顯存?,F(xiàn)P4 算力達(dá) ?15 PetaFLOPS?,推理速度較前代 Hopper 架構(gòu)提升 ?40 倍??。
    • 推出 ?NVL72 超節(jié)點(diǎn)架構(gòu)?,支持 72 顆 GPU 互聯(lián),面向大規(guī)模推理場(chǎng)景,性能較傳統(tǒng) 8 卡服務(wù)器提升 ? 50% ?。
    • 計(jì)劃 2025 年第三季度量產(chǎn),HBM 容量從 192GB 升級(jí)至 288GB,運(yùn)算效能較 B200 提升 ? 50% ??。

NVIDIA Blackwell數(shù)據(jù)手冊(cè)免費(fèi)下載 涵蓋了NVIDIA Blackwell數(shù)據(jù)表中的關(guān)鍵信息
*附件:blackwell-datasheet-3645868.pdf

NVIDIA Blackwell 架構(gòu)打破生成式 AI 和加速計(jì)算的壁壘

探索 NVIDIA Blackwell 架構(gòu)為生成式 AI 和加速計(jì)算帶來(lái)的突破性進(jìn)步。Blackwell 基于多代 NVIDIA 技術(shù)構(gòu)建,以出眾的性能、效率和規(guī)模揭開(kāi)了生成式 AI 領(lǐng)域的新篇章。

新型 AI 超級(jí)芯片

Blackwell 架構(gòu) GPU 具有 2080 億個(gè)晶體管,采用專門定制的臺(tái)積電 4NP 工藝制造。所有 Blackwell 產(chǎn)品均采用雙倍光刻極限尺寸的裸片,通過(guò) 10 TB/s 的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的 GPU。

第二代 Transformer 引擎

第二代 Transformer 引擎將定制的 Blackwell Tensor Core技術(shù)與 NVIDIA? TensorRT? -LLM 和 NeMo? 框架創(chuàng)新相結(jié)合,加速大語(yǔ)言模型 (LLM) 和專家混合模型 (MoE) 的推理和訓(xùn)練。

為了強(qiáng)效助力 MoE 模型的推理 Blackwell Tensor Core增加了新的精度 (包括新的社區(qū)定義的微縮放格式),可提供較高的準(zhǔn)確性并輕松替換更大的精度。Blackwell Transformer 引擎利用稱為微張量縮放的細(xì)粒度縮放技術(shù),優(yōu)化性能和準(zhǔn)確性,支持 4 位浮點(diǎn) (FP4) AI。這將內(nèi)存可以支持的新一代模型的性能和大小翻倍,同時(shí)保持高精度

安全 AI

Blackwell 內(nèi)置 NVIDIA 機(jī)密計(jì)算技術(shù),可通過(guò)基于硬件的強(qiáng)大安全性保護(hù)敏感數(shù)據(jù)和 AI 模型,使其免遭未經(jīng)授權(quán)的訪問(wèn)。Blackwell 是業(yè)內(nèi)首款具備可信執(zhí)行環(huán)境 (TEE) I/O 功能的 GPU,它不僅能夠與具備 TEE-I/O 功能的主機(jī)一同提供性能卓越的機(jī)密計(jì)算解決方案,還能通過(guò) NVIDIA? NVLink? 技術(shù)提供實(shí)時(shí)保護(hù)。與未加密模式相比, Blackwell 機(jī)密計(jì)算功能供了幾乎相同的吞吐量性能。現(xiàn)在,除了保護(hù) AI 知識(shí)產(chǎn)權(quán) (IP) 和安全地實(shí)現(xiàn)機(jī)密 AI 訓(xùn)練、推理和聯(lián)邦學(xué)習(xí),企業(yè)甚至還能以高性能的方式保護(hù)最大的模型。

NVLink、NVSwitch 和 NVLink Switch 系統(tǒng)

是否能釋放百億億級(jí)計(jì)算和萬(wàn)億參數(shù) AI 模型的全部潛力取決于服務(wù)器集群中每個(gè) GPU 之間能否快速、順暢的通信。第五代 NVIDIA? NVLink? 可擴(kuò)展至 576 個(gè) GPU,為萬(wàn)億和數(shù)萬(wàn)億參數(shù) AI 模型釋放加速性能。

NVIDIA NVLink 交換機(jī)芯片可在一個(gè)有 72 個(gè) GPU 的 NVLink 域 (NVL72) 中實(shí)現(xiàn) 130TB/s 的 GPU 帶寬,并通過(guò) NVIDIA SHARP? 技術(shù)對(duì) FP8 的支持實(shí)現(xiàn) 4 倍于原來(lái)的帶寬效率。NVIDIA NVLink 交換機(jī)芯片能以驚人的 1.8TB/s 互連速度為多服務(wù)器集群提供支持。采用 NVLink 的多服務(wù)器集群可以在計(jì)算量增加的情況下同步擴(kuò)展 GPU 通信,因此 NVL72 可支持的 GPU 吞吐量是單個(gè) 8 卡 GPU 系統(tǒng)的 9 倍。

解壓縮引擎

過(guò)去,數(shù)據(jù)分析和數(shù)據(jù)庫(kù)工作流依賴 CPU 進(jìn)行計(jì)算。加速數(shù)據(jù)科學(xué)可以顯著提高端到端分析性能,加速價(jià)值創(chuàng)造,同時(shí)降低成本。Apache Spark 等數(shù)據(jù)庫(kù)在接手、處理和分析大量數(shù)據(jù)等數(shù)據(jù)分析工作上發(fā)揮著關(guān)鍵作用。

Blackwell 擁有的解壓縮引擎以及通過(guò) 900GB/s 雙向帶寬的高速鏈路訪問(wèn) NVIDIA Grace? CPU 中大量?jī)?nèi)存的能力,可加速整個(gè)數(shù)據(jù)庫(kù)查詢工作流,從而在數(shù)據(jù)分析和數(shù)據(jù)科學(xué)方面實(shí)現(xiàn)更高性能。Blackwell 支持 LZ4、Snappy 和 Deflate 等最新壓縮格式。

可靠性、可用性和可服務(wù)性 (RAS) 引擎

Blackwell 通過(guò)專用的可靠性、可用性和可服務(wù)性 (RAS) 引擎增加了智能恢復(fù)能力,以識(shí)別早期可能發(fā)生的潛在故障,從而更大限度地減少停機(jī)時(shí)間。NVIDIA AI 驅(qū)動(dòng)的預(yù)測(cè)管理功能持續(xù)監(jiān)控硬件和軟件中數(shù)千個(gè)數(shù)據(jù)點(diǎn)的整體運(yùn)行狀況,以預(yù)測(cè)和攔截停機(jī)時(shí)間和低效的來(lái)源。這建立了智能可靠性技術(shù),節(jié)省時(shí)間、能源和計(jì)算成本。

NVIDIA 的 RAS 引擎提供深入的診斷信息,可以識(shí)別關(guān)注領(lǐng)域并制定維護(hù)計(jì)劃。RAS 引擎通過(guò)快速定位問(wèn)題來(lái)源縮短周轉(zhuǎn)時(shí)間,并通過(guò)促進(jìn)有效的補(bǔ)救最大限度地減少停機(jī)時(shí)間。

NVIDIA Blackwell 數(shù)據(jù)表總結(jié)

一、概述

  • ?NVIDIA Blackwell?:被譽(yù)為新工業(yè)革命的引擎,為生成式AI和加速計(jì)算帶來(lái)突破性進(jìn)展。通過(guò)第二代Transformer Engine和更快的NVLink?互聯(lián),數(shù)據(jù)中心性能大幅提升。

二、核心組件與性能

  1. ?GB200 NVL72?
    • 連接36顆Grace CPU和72顆Blackwell GPU,采用NVLink連接和液冷設(shè)計(jì),形成單一大規(guī)模GPU,實(shí)現(xiàn)30倍更快的實(shí)時(shí)萬(wàn)億參數(shù)大語(yǔ)言模型(LLM)推理。
    • 支持高達(dá)17TB的LPDDR5X內(nèi)存和13.5TB的HBM3E內(nèi)存,NVLink域提供130TB/s的低延遲GPU通信。
  2. ?HGX B200?
    • 集成NVIDIA Blackwell GPU和高速互聯(lián),加速AI性能。
    • 實(shí)現(xiàn)高達(dá)15倍更快的實(shí)時(shí)推理性能,12倍更低的成本和能耗。
    • 配備8顆Blackwell GPU,支持高達(dá)1.4TB的HBM3E內(nèi)存。

三、技術(shù)亮點(diǎn)

  • ?第二代Transformer Engine?:支持FP4 AI,通過(guò)新一代Tensor Cores實(shí)現(xiàn)高精度和高吞吐量。
  • ?NVLink與液冷?:GB200 NVL72利用NVLink和液冷技術(shù)創(chuàng)建單一72-GPU機(jī)架,克服通信瓶頸。
  • ?高速內(nèi)存與互聯(lián)?:第五代NVLink提供1.8TB/s的GPU-to-GPU互聯(lián)。
  • ?能源效率?:液冷GB200 NVL72機(jī)架降低數(shù)據(jù)中心碳足跡和能耗,與H100空氣冷卻基礎(chǔ)設(shè)施相比,性能提升25倍。

四、應(yīng)用場(chǎng)景與性能數(shù)據(jù)

  1. ?大規(guī)模訓(xùn)練?
    • GB200 NVL72的第二代Transformer Engine支持FP8精度,實(shí)現(xiàn)4倍更快的大規(guī)模LLM訓(xùn)練。
    • 訓(xùn)練GPT-MoE-1.8T模型時(shí),性能較HGX H100顯著提升。
  2. ?數(shù)據(jù)處理?
    • GB200 NVL72加速關(guān)鍵數(shù)據(jù)庫(kù)查詢,性能較CPU提升18倍,總擁有成本(TCO)降低5倍。
  3. ?實(shí)時(shí)推理?
    • HGX B200實(shí)現(xiàn)GPT-MoE-1.8T模型實(shí)時(shí)推理性能較HGX H100提升15倍。

五、可持續(xù)性與安全性

  • ?可持續(xù)計(jì)算?:通過(guò)采用可持續(xù)計(jì)算實(shí)踐,數(shù)據(jù)中心可降低碳足跡和能耗,同時(shí)提高底線。HGX B200較Hopper一代在LLM推理性能上提高能源效率12倍,降低TCO 12倍。
  • ?安全AI?:Blackwell包含NVIDIA Confidential Computing,保護(hù)敏感數(shù)據(jù)和AI模型免受未經(jīng)授權(quán)的訪問(wèn)。

六、技術(shù)規(guī)格

  • ?GB200 NVL72?:72顆Blackwell GPU,36顆Grace CPU,總FP4 Tensor Core性能達(dá)1440 PFLOPS,總內(nèi)存帶寬高達(dá)576TB/s。
  • ?HGX B200?:8顆Blackwell GPU,總FP4 Tensor Core性能達(dá)144 PFLOPS,總內(nèi)存帶寬高達(dá)62TB/s。

七、附加功能

  • ?解壓縮引擎?:加速數(shù)據(jù)庫(kù)查詢的完整管道,支持最新壓縮格式。
  • ?RAS引擎?:提供智能彈性,通過(guò)專用可靠性、可用性和可服務(wù)性(RAS)引擎識(shí)別潛在故障。
  • ?NVIDIA AI Enterprise?:提供端到端軟件平臺(tái),簡(jiǎn)化AI就緒平臺(tái)的構(gòu)建,加速價(jià)值實(shí)現(xiàn)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106429
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    376

    瀏覽量

    616
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

    ,宣布推出高性能的SuperCluster。這一端對(duì)端AI數(shù)據(jù)中心解決方案采用NVIDIA Blackwell平臺(tái),專為兆級(jí)參數(shù)規(guī)模的生成式AI時(shí)代所設(shè)計(jì)。全新SuperCluster將可大幅增加液冷
    發(fā)表于 11-25 10:39 ?785次閱讀
    Supermicro推出直接液冷優(yōu)化的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b>解決方案

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    ,同時(shí)降低水消耗。利用NVIDIA Blackwell架構(gòu)的高帶寬內(nèi)存性能、NVLink-C2C和專用解壓縮引擎,GB200大幅提高關(guān)鍵數(shù)據(jù)庫(kù)查詢的速度,比CPU提升18倍,并將總體擁
    發(fā)表于 05-13 17:16

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù),可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)萬(wàn)個(gè),通過(guò)
    發(fā)表于 03-19 10:56 ?753次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> <b class='flag-5'>架構(gòu)</b> DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    NVIDIA推出搭載GB200 Grace Blackwell超級(jí)芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時(shí)間 3 月 18 日發(fā)布新一代 AI 超級(jí)計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級(jí)芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?1331次閱讀

    英偉達(dá)Blackwell架構(gòu),行業(yè)首選

    的半導(dǎo)體技術(shù)路徑圖,首度公開(kāi)了即將面世的下一代芯片——Rubin平臺(tái),旨在接替現(xiàn)有的Blackwell。   回顧過(guò)往,NVIDIA始終保持著每?jī)赡臧l(fā)布一次全新架構(gòu)的傳統(tǒng),從20
    的頭像 發(fā)表于 06-05 15:28 ?1086次閱讀

    英偉達(dá)聯(lián)合計(jì)算機(jī)制造商發(fā)布Blackwell架構(gòu)系統(tǒng)

    近日,NVIDIA與全球多家知名計(jì)算機(jī)制造商聯(lián)手,共同推出了一系列采用NVIDIA Blackwell架構(gòu)的新系統(tǒng)。這些系統(tǒng)不僅配備了NVIDIA
    的頭像 發(fā)表于 06-06 10:52 ?870次閱讀

    NVIDIA AI芯片Blackwell推遲發(fā)布引熱議,公司強(qiáng)調(diào)Hopper需求強(qiáng)勁

    據(jù)8月5日最新消息,NVIDIA新款A(yù)I芯片Blackwell因被曝存在設(shè)計(jì)缺陷而推遲發(fā)布的消息,迅速在業(yè)界引發(fā)了廣泛討論與關(guān)注。面對(duì)這一市場(chǎng)傳聞,NVIDIA官方迅速作出回應(yīng),強(qiáng)調(diào)其旗艦產(chǎn)品
    的頭像 發(fā)表于 08-05 15:05 ?848次閱讀

    NVIDIA未來(lái)1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無(wú)疑已成為NVIDIA歷史上極為成功的產(chǎn)品典范,其市場(chǎng)需求量已攀升至前所未有的高峰。   憑借在全球AI算力領(lǐng)域的領(lǐng)先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發(fā)表于 10-12 16:20 ?1047次閱讀

    NVIDIA Blackwell平臺(tái)帶來(lái)性能躍升

    Blackwell 完成的每一項(xiàng)測(cè)試,都為各項(xiàng) AI 應(yīng)用樹(shù)立了訓(xùn)練性能新標(biāo)桿。
    的頭像 發(fā)表于 11-19 14:24 ?661次閱讀

    NVIDIA向開(kāi)放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開(kāi)放計(jì)算項(xiàng)目(OCP),并擴(kuò)大 NVIDIA
    的頭像 發(fā)表于 11-19 15:30 ?665次閱讀

    MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級(jí)芯片

    MediaTek近日正式宣布與NVIDIA攜手合作,共同設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級(jí)芯片。這款芯片將被應(yīng)用于NVIDIA的個(gè)人AI超級(jí)計(jì)算機(jī)——
    的頭像 發(fā)表于 01-08 15:32 ?1013次閱讀

    MediaTek與NVIDIA攜手設(shè)計(jì)GB10 Grace Blackwell超級(jí)芯片

    MediaTek與NVIDIA近日宣布了一項(xiàng)重要合作,雙方將共同設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級(jí)芯片。這款超級(jí)芯片將被應(yīng)用于NVIDIA的個(gè)人AI超級(jí)計(jì)算
    的頭像 發(fā)表于 01-13 10:48 ?600次閱讀

    Supermicro提高NVIDIA Blackwell機(jī)架級(jí)解決方案產(chǎn)量

    Supermicro, Inc.,作為人工智能/機(jī)器學(xué)習(xí)、高性能計(jì)算、云、存儲(chǔ)和5G/Edge領(lǐng)域的整體IT解決方案提供商,近日宣布其基于NVIDIA Blackwell平臺(tái)加速的端對(duì)端人工智能
    的頭像 發(fā)表于 02-11 09:45 ?412次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?733次閱讀

    NVIDIA Blackwell白皮書(shū):NVIDIA Blackwell Architecture Technical Brief

    NVIDIA Blackwell白皮書(shū):NVIDIA Blackwell Architecture Technical Brief
    的頭像 發(fā)表于 03-20 18:35 ?741次閱讀
    主站蜘蛛池模板: 国产三级日本三级韩国三级在线观看 | 欧美综合久久 | 日本最新免费网站 | 色噜噜狠狠成人网 | 一级aaaaaa片毛片在线播放 | 看黄免费在线 | 午夜免费啪在线观看视频网站 | 亚洲一区免费在线观看 | 最猛91大神ben与女教师 | 六月婷婷激情综合 | 久久波多野结衣 | 傲视影院午夜毛片 | 免费在线观看你懂的 | 国产性大片黄在线观看在线放 | 亚洲综合久久综合激情久久 | 国产va在线 | 日本亚洲黄色 | 国产成人精品曰本亚洲 | 四虎电影免费观看网站 | 久久久久女人精品毛片九一 | 美女扒开尿囗给男人玩的动图 | 最近2018中文字幕免费看2019 | 国产精品怡红院永久免费 | 亚洲精品中文字幕乱码三区一二 | 国产午夜不卡在线观看视频666 | 午夜影视网站 | 激情综合丝袜美女一区二区 | 在线观看国产精美视频 | 插插插叉叉叉 | 欧美一级片网站 | 天天干天天操天天玩 | 天天看天天操 | 亚洲电影av| 国产二区三区 | 男啪女色黄无遮挡免费观看 | 天天爽夜夜爽精品视频一 | 亚洲 欧美 另类 综合 日韩 | 四虎tv在线观看884aa | 免费一级毛片在级播放 | 在线播放网址 | 开心六月婷婷 |