在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練,實時大語言模型推理

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-09-04 09:10 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)在近日的Hot Chips 2024大會上,英偉達(dá)公布了下一代GPU架構(gòu)Blackwell的更多細(xì)節(jié)信息,以及未來的產(chǎn)品路線圖。

英偉達(dá)Blackwell是通用計算全棧矩陣的終極解決方案,由多個英偉達(dá)芯片組成,包括Blackwell GPU、Grace CPU、BlueField數(shù)據(jù)處理單元、ConnectX網(wǎng)絡(luò)接口卡、NVLink交換機(jī)、Spectrum以太網(wǎng)交換機(jī)和Quantum InfiniBand交換機(jī)。

英偉達(dá)稱,Blackwell擁有6項革命性技術(shù),可支持多達(dá)10萬億參數(shù)的模型進(jìn)行AI訓(xùn)練和實時大語言模型(LLM)推理。

NVIDIA Blackwell 的技術(shù)特點

NVIDIA Blackwell 架構(gòu)是NVIDIA于2024年3月在NVIDIA GTC大會上發(fā)布的全新架構(gòu),是NVIDIA繼Hopper架構(gòu)之后推出的全新架構(gòu),旨在推動生成式AI和加速計算領(lǐng)域的發(fā)展。Blackwell架構(gòu)擁有六項革命性技術(shù),這些技術(shù)共同構(gòu)成了其強(qiáng)大的計算能力和高效性。

一、它是全球最強(qiáng)大的芯片,擁有2080億個晶體管,這確保了芯片具有極高的計算能力和復(fù)雜性。它采用臺積電4納米工藝制造,提高了芯片的集成度,降低了功耗和發(fā)熱量。配備192GB的HBM3E顯存,極大提升了芯片的數(shù)據(jù)處理能力和效率。

第二代Transformer引擎,結(jié)合Blackwell Tensor Core技術(shù)和TensorRT-LLM及NeMo Megatron框架中的英偉達(dá)先進(jìn)動態(tài)范圍管理算法,Blackwell通過新的4位浮點AI支持雙倍的計算和模型大小推理能力。

第五代NVLink,為每個GPU提供了突破性的1.8TB/s雙向吞吐量,確保最復(fù)雜LLM之間多達(dá)576個GPU之間的無縫高速通信

四、RAS引擎,Blackwell支持的GPU包含一個專用引擎,實現(xiàn)可靠性、可用性和服務(wù)性。此外,Blackwell架構(gòu)還增加了芯片級功能,利用基于AI的預(yù)防性維護(hù)進(jìn)行診斷和預(yù)測可靠性問題,從而延長系統(tǒng)正常運行時間并提高大規(guī)模部署AI的彈性。

五、安全人工智能,先進(jìn)的機(jī)密計算功能可在不影響性能的情況下保護(hù)AI模型和客戶數(shù)據(jù),并支持新的本機(jī)接口加密協(xié)議,進(jìn)一步增強(qiáng)了芯片的安全性。

六、解壓縮引擎,專用解壓縮引擎支持最新格式,加快數(shù)據(jù)庫查詢,提供數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的最高性能。

生態(tài)系統(tǒng)方面,Blackwell不僅是系統(tǒng)的核心芯片,更是一個全新的平臺。它涵蓋了從CPU和GPU計算到用于互連的不同類型的網(wǎng)絡(luò),是通用計算全棧矩陣的終極解決方案。

Blackwell架構(gòu)將助推數(shù)據(jù)處理、工程模擬、電子設(shè)計自動化、計算機(jī)輔助藥物設(shè)計、量子計算和生成式AI等領(lǐng)域?qū)崿F(xiàn)突破。

NVIDIA已經(jīng)展示了基于Blackwell架構(gòu)的GPU GB200 NVL72等產(chǎn)品,該產(chǎn)品專為萬億參數(shù)AI而設(shè)計,對大語言模型(LLM)推理性能提升高達(dá)30倍。隨著AI模型尺寸的增加,在多個GPU上拆分工作負(fù)載勢在必行。而Blackwell足夠強(qiáng)大,可以在一個GPU中處理專家模型。

相比Hopper架構(gòu)的優(yōu)勢

NVIDIA Blackwell架構(gòu)相比其上一個NVIDIA Hopper架構(gòu)具有多方面的優(yōu)勢。NVIDIA Hopper架構(gòu)是NVIDIA在2022年推出的GPU架構(gòu),該架構(gòu)旨在取代之前的NVIDIA Ampere架構(gòu),并為新一代工作負(fù)載提供強(qiáng)大的加速計算平臺。

Hopper架構(gòu)采用了先進(jìn)的臺積電4N工藝制造,集成了超過800億個晶體管,這為高性能計算提供了堅實的基礎(chǔ)。

Hopper架構(gòu)通過Transformer引擎推進(jìn)了Tensor Core技術(shù)的發(fā)展,旨在加速AI模型訓(xùn)練。Transformer引擎能夠應(yīng)用混合的FP8和FP16精度,以大幅加速Transformer模型的AI計算。

與上一代相比,Hopper架構(gòu)在TF32、FP64、FP16和INT8精度的每秒浮點運算(FLOPS)上提高了3倍。這種性能提升使得Hopper在處理大規(guī)模AI模型時更加高效。

Hopper架構(gòu)引入了第四代NVLink技術(shù),可通過NVIDIA DGX和HGX服務(wù)器擴(kuò)展多GPU輸入和輸出(IO),每個GPU的雙向傳輸速率可達(dá)900GB/s,比PCIe 5.0的帶寬高7倍。

第三代NVIDIA NVSwitch支持SHARP網(wǎng)絡(luò)計算技術(shù),打破了該技術(shù)只能通過InfiniBand提供的傳統(tǒng)限制。這使得Hopper架構(gòu)在處理大規(guī)模HPC和AI工作負(fù)載時能夠?qū)崿F(xiàn)更高的互連效率和通信帶寬。

相比較而言,晶體管數(shù)量與計算能力方面,Blackwell架構(gòu)GPU擁有2080億個晶體管,比Hopper架構(gòu)的GPU多出顯著數(shù)量,這直接提升了其計算能力。

Blackwell架構(gòu)的單個芯片計算能力達(dá)到了20 petaFLOPS,這使其在處理大規(guī)模AI模型時具有更高的實時性能和效率。

內(nèi)存與帶寬方面,Blackwell架構(gòu)配備了更大的HBM3e內(nèi)存(如192GB)和更高的顯存帶寬(如8TB/s),相比Hopper架構(gòu),這進(jìn)一步增強(qiáng)了數(shù)據(jù)處理和傳輸?shù)乃俣取?br />
寫在最后

NVIDIA Blackwell架構(gòu)相比其上一個架構(gòu)在性能、計算能力、技術(shù)創(chuàng)新、特性增強(qiáng)以及生態(tài)系統(tǒng)與應(yīng)用拓展等方面均具有顯著優(yōu)勢。應(yīng)用方面,Blackwell架構(gòu)將助推數(shù)據(jù)處理、工程模擬、電子設(shè)計自動化、計算機(jī)輔助藥物設(shè)計、量子計算和生成式AI等領(lǐng)域?qū)崿F(xiàn)突破。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4870

    瀏覽量

    130253
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33281

    瀏覽量

    273602
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3898

    瀏覽量

    92795
收藏 人收藏

    評論

    相關(guān)推薦

    AI模型不再依賴英偉達(dá)GPU?蘋果揭秘自研大模型

    ,獲得足夠的算力構(gòu)建自己的計算中心,用于訓(xùn)練不同應(yīng)用的AI模型AI領(lǐng)域眾星捧月也造就了英偉達(dá)
    的頭像 發(fā)表于 08-05 06:07 ?4282次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>不再依賴<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GPU?蘋果揭秘自研大<b class='flag-5'>模型</b>

    英偉達(dá)Cosmos-Reason1 模型深度解讀

    英偉達(dá)近期發(fā)布的 Cosmos-Reason1 模型在物理常識推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計的多模態(tài)大語言
    的頭像 發(fā)表于 03-29 23:29 ?1331次閱讀

    英偉達(dá)GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達(dá)GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?479次閱讀

    英偉達(dá)發(fā)布Nemotron-CC大型AI訓(xùn)練數(shù)據(jù)庫

    ,Nemotron-CC數(shù)據(jù)庫總計包含了驚人的6.3萬億個Token,其中1.9萬億為精心合成的數(shù)據(jù)。這一龐大的數(shù)據(jù)量不僅為AI模型訓(xùn)練
    的頭像 發(fā)表于 01-14 14:14 ?328次閱讀

    語言模型開發(fā)框架是什么

    語言模型開發(fā)框架是指用于訓(xùn)練推理和部署大型語言模型的軟件工具和庫。下面,
    的頭像 發(fā)表于 12-06 10:28 ?368次閱讀

    英偉達(dá)震撼發(fā)布:全新AI模型參數(shù)規(guī)模躍升至80億量級

    8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計算效益大等優(yōu)
    的頭像 發(fā)表于 08-23 16:08 ?947次閱讀

    蘋果AI模型訓(xùn)練新動向:攜手谷歌,未選英偉達(dá)

    近日,蘋果公司發(fā)布的最新研究報告揭示了其在人工智能領(lǐng)域的又一重要戰(zhàn)略選擇——采用谷歌設(shè)計的芯片來訓(xùn)練AI模型,而非行業(yè)巨頭英偉達(dá)的產(chǎn)品。這
    的頭像 發(fā)表于 08-01 18:11 ?1029次閱讀

    英偉達(dá)開源Nemotron-4 340B系列模型,助力大型語言模型訓(xùn)練

    近日,英偉達(dá)宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言模型(LLM)
    的頭像 發(fā)表于 06-17 14:53 ?756次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化AI
    的頭像 發(fā)表于 06-04 09:15 ?853次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    計算工作負(fù)載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)
    發(fā)表于 05-13 17:16

    【大語言模型:原理與工程實踐】大語言模型的應(yīng)用

    。 關(guān)于大語言模型是否具備與人類“系統(tǒng)2”相似的能力,存在廣泛的爭議。然而,隨著模型參數(shù)量的增加和大規(guī)模預(yù)訓(xùn)練的實施,大
    發(fā)表于 05-07 17:21

    【大語言模型:原理與工程實踐】大語言模型的評測

    是否與事實或邏輯相符;以及推理過程的完整性,即模型在解題過程中是否提供了完整的推理鏈或證據(jù)支持。 摘要生成類評測任務(wù):考察大語言
    發(fā)表于 05-07 17:12

    【大語言模型:原理與工程實踐】大語言模型的預(yù)訓(xùn)練

    語言模型的核心特點在于其龐大的參數(shù)量,這賦予了模型強(qiáng)大的學(xué)習(xí)容量,使其無需依賴微調(diào)即可適應(yīng)各種下游任務(wù),而更傾向于培養(yǎng)通用的處理能力。然而,隨著學(xué)習(xí)容量的增加,對預(yù)
    發(fā)表于 05-07 17:10

    【大語言模型:原理與工程實踐】大語言模型的基礎(chǔ)技術(shù)

    特定任務(wù)對模型進(jìn)行微調(diào)。這種方法的成功不僅是自然語言處理發(fā)展的一個轉(zhuǎn)折點,還為許多現(xiàn)實世界的應(yīng)用場帶來了前所未有的性能提升。從廣為人知的GPT到BERT,預(yù)訓(xùn)練模型
    發(fā)表于 05-05 12:17

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    豐富的常識知識,能夠基于常識進(jìn)行推理,填補(bǔ)信息空白,并作出合理推斷。隨著訓(xùn)練規(guī)模和參數(shù)量的增加,大語言模型
    發(fā)表于 05-04 23:55
    主站蜘蛛池模板: 在线观看网站国产 | 亚洲一区二区三区高清视频 | 色综合天天综合中文网 | 涩涩爱影院 | 午夜在线观看免费高清在线播放 | 一级网站在线观看 | 49pao强力在线高清基地 | 国产一区二区在线不卡 | 2017天天操| 日韩欧美在线中文字幕 | 欧美成人性色 | 免费爱爱网址 | susu成人影院 | 午夜小影院 | 李老汉的性生生活2 | 国产精品久久久久久久久kt | 午夜亚洲国产精品福利 | 操美女的视频网站 | 黄色大全片| 国产精品福利久久2020 | 免费视频www | 一区二区三区视频网站 | 久久手机看片 | 亚洲1314| 欧美色图综合网 | 美女网站一区二区三区 | 日日碰狠狠添天天爽五月婷 | 69堂在线观看国产成人 | semimi亚洲综合在线观看 | 台湾佬自偷自拍情侣在线 | 欧美xxxxxbbbb | 曰本性l交片视频视频 | 亚洲国产色婷婷精品综合在线观看 | 特黄特黄aaaa级毛片免费看 | 婷婷综合久久中文字幕 | good韩国理论在线三级 | 老师受不了了好硬好大 | 国产午夜精品久久久久免费视小说 | 2022欧美高清中文字幕在线看 | 毛片毛片毛片毛片毛片毛片 | 日本精高清区一 |