在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

應(yīng)用NVIDIA Spectrum-X網(wǎng)絡(luò)構(gòu)建新型主權(quán)AI云

NVIDIA英偉達(dá) ? 來(lái)源: NVIDIA英偉達(dá) ? 2024-07-26 18:58 ? 次閱讀

法國(guó)云服務(wù)提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPUSpectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)構(gòu)建區(qū)域性 GPU 集群,為用戶提供 AI 按需服務(wù)業(yè)務(wù)。

Scaleway 是法國(guó)的一家擁有高性能基礎(chǔ)設(shè)施的云服務(wù)提供商,創(chuàng)立于 1999 年,擁有 80+ 云產(chǎn)品及服務(wù),為全球 25,000+ 客戶提供云服務(wù),客戶包括 Mistral AI、Aternos、Hugging Face、Golem.ai 等。Scaleway 提供一站式的云服務(wù),以開(kāi)發(fā)創(chuàng)新解決方案并幫助用戶從零開(kāi)始構(gòu)建和擴(kuò)展 AI 項(xiàng)目,目前 Scaleway 正在構(gòu)建區(qū)域 AI 云,提供 GPU 基礎(chǔ)設(shè)施,用于大規(guī)模的 AI 模型訓(xùn)練、推理及部署。

客戶挑戰(zhàn)

云 AI 工作負(fù)載需求正以前所未有的速度增長(zhǎng),同時(shí)生成式 AI 應(yīng)用也在激增。為滿足客戶部署生成式 AI 應(yīng)用程序、訓(xùn)練基礎(chǔ) AI 大模型的需求,云服務(wù)提供商面臨巨大挑戰(zhàn),需要構(gòu)建 AI 云,使用加速計(jì)算技術(shù)和高性能網(wǎng)絡(luò)來(lái)支持 AI 業(yè)務(wù)。

Scaleway 的核心需求包括:

對(duì)于分布式 AI 訓(xùn)練任務(wù),單個(gè)任務(wù)的訓(xùn)練時(shí)間由最慢的計(jì)算節(jié)點(diǎn)的運(yùn)行時(shí)間決定,這使得尾部延遲至關(guān)重要。AI 云需要一個(gè)高吞吐、低延遲、低抖動(dòng)、易擴(kuò)展的高性能網(wǎng)絡(luò),來(lái)確保 GPU 間快速、高效的通信,尤其是在大規(guī)模部署的場(chǎng)景下。

在多個(gè) AI 任務(wù)同時(shí)運(yùn)行的多租戶環(huán)境中,性能隔離對(duì)于保護(hù)一個(gè)租戶的 AI 任務(wù)免受其他租戶業(yè)務(wù)的影響是必不可少的。由此提出了對(duì)多租戶多任務(wù)場(chǎng)景下性能隔離的需求。

對(duì)于復(fù)雜的 AI 云環(huán)境,需要專(zhuān)門(mén)適用于 AI 網(wǎng)絡(luò)的監(jiān)控管理工具,提供細(xì)粒度的網(wǎng)絡(luò)可視化功能、同時(shí)具備網(wǎng)絡(luò)監(jiān)控和故障定位能力。

為實(shí)現(xiàn) AI 云數(shù)據(jù)中心的高效、快速部署,需要強(qiáng)大的網(wǎng)絡(luò)仿真及自動(dòng)化平臺(tái)。

隨著云上用戶、數(shù)據(jù)、應(yīng)用的快速增長(zhǎng),網(wǎng)絡(luò)安全威脅不容忽視,需要提供私有的、安全的零信任基礎(chǔ)設(shè)施,保障用戶的業(yè)務(wù)安全。

解決方案

Scaleway 采用了 NVIDIA 的 Hopper GPU 和 Spectrum-X 網(wǎng)絡(luò)平臺(tái)應(yīng)對(duì)以上挑戰(zhàn)。

Scaleway 將 HGX Hopper GPU 服務(wù)器加入其 GPU 集群陣容中,以覆蓋廣泛的計(jì)算需求,利用 GPU 的速度和效率加速 AI 分布式工作負(fù)載。

對(duì)于 Scale-Out AI 網(wǎng)絡(luò),Scaleway 采用了基于 BlueField-3 SuperNICSpectrum SN5600 交換機(jī)構(gòu)建的 Spectrum-X 網(wǎng)絡(luò)平臺(tái)。NVIDIA 的 Spectrum-X 網(wǎng)絡(luò)平臺(tái)是全球首個(gè)專(zhuān)為 AI 構(gòu)建的以太網(wǎng)端到端解決方案,與傳統(tǒng)以太網(wǎng)相比,其生成式 AI 訓(xùn)練的網(wǎng)絡(luò)通信效率提高了 1.6 倍。

同時(shí) Spectrum-X 部署將利用以下網(wǎng)絡(luò)軟件堆棧:

NVIDIA Air 用于 AI 網(wǎng)絡(luò)仿真,NVIDIA Air 是一個(gè)云托管的數(shù)據(jù)中心網(wǎng)絡(luò)仿真平臺(tái),其行為類(lèi)似于真實(shí)世界的生產(chǎn)環(huán)境。使用 NVIDIA Air 創(chuàng)建數(shù)據(jù)中心的數(shù)字孿生,可以驗(yàn)證網(wǎng)絡(luò)配置、網(wǎng)絡(luò)功能以及自動(dòng)化部署代碼,提升數(shù)據(jù)中心的部署效率。

NetQ 用于 AI 網(wǎng)絡(luò)監(jiān)控,通過(guò)高頻遙測(cè)技術(shù)監(jiān)控 AI 工作負(fù)載,NetQ 提供有關(guān)數(shù)據(jù)中心運(yùn)行狀況的數(shù)據(jù)和統(tǒng)計(jì)信息,關(guān)聯(lián)配置和運(yùn)行狀態(tài),并跟蹤狀態(tài)變化。基于遙測(cè)信息,NetQ 提供動(dòng)態(tài)路由監(jiān)控,RoCE 流量計(jì)數(shù)器,交換機(jī)隊(duì)列直方圖等功能,以識(shí)別和應(yīng)對(duì)網(wǎng)絡(luò)微突發(fā)、擁塞場(chǎng)景,方便網(wǎng)絡(luò)故障定位。

Cumulus Linux 用于軟件驅(qū)動(dòng)的數(shù)據(jù)中心網(wǎng)絡(luò)自動(dòng)化,Cumulus Linux 是創(chuàng)新的開(kāi)放網(wǎng)絡(luò)操作系統(tǒng),支持 BGP/OSPF 路由協(xié)議,以太網(wǎng)虛擬專(zhuān)用網(wǎng)絡(luò) EVPN,虛擬路由和轉(zhuǎn)發(fā)。

DOCA SDK 和庫(kù)用于增強(qiáng) BlueField-3 SuperNIC 性能,DOCA SDK 提供行業(yè)標(biāo)準(zhǔn)的開(kāi)放 API 和軟件框架,包括針對(duì) RDMA、網(wǎng)絡(luò)、安全、存儲(chǔ)、數(shù)據(jù)路徑加速的 SDK,幫助開(kāi)發(fā)者快速創(chuàng)建軟件定義、SuperNIC 加速的服務(wù)。

使用的 NVIDIA 產(chǎn)品

硬件:

NVIDIA HGX Hopper 服務(wù)器

NVIDIA Spectrum-4 SN5600 以太網(wǎng)交換機(jī)

NVIDIA BlueField-3 B3140H SuperNICs

軟件:

Cumulus Linux 網(wǎng)絡(luò)操作系統(tǒng)

NetQ 監(jiān)控管理平臺(tái)

NVIDIA Air 仿真平臺(tái)

DOCA SDK

實(shí)際效果

采用 NVIDIA 的整體解決方案后,極大地提升了 AI 計(jì)算能力,縮短了 AI 訓(xùn)練時(shí)間,同時(shí)加速了 AI 解決方案的開(kāi)發(fā)、部署和上市時(shí)間,有效提高了投資回報(bào)率。

Scaleway 客戶可以從幾個(gè) GPU 擴(kuò)展到幾千個(gè) GPU,以適應(yīng)任何 AI 用例

Spectrum-X 提供多租戶、多任務(wù)的 AI 環(huán)境所需的高性能和安全性, 借助動(dòng)態(tài)路由、擁塞控制、全局共享緩沖區(qū)等多種機(jī)制,實(shí)現(xiàn)了多任務(wù)的性能隔離。

NetQ 提供對(duì) AI 網(wǎng)絡(luò)健康狀況的深度可視性,具有 RoCE 流量計(jì)數(shù)器、事件和 WJH(What Just Happened)警報(bào)等豐富的儀表板,實(shí)現(xiàn) AI 網(wǎng)絡(luò)可視化、故障排除和驗(yàn)證功能。

NVIDIA Air 和 Cumulus Linux 支持 API 原生網(wǎng)絡(luò)環(huán)境,該環(huán)境可集成到 DevOps 工具鏈中,實(shí)現(xiàn)了第 0 天、第 1 天 和第 2 天操作的無(wú)縫銜接。

NVIDIA 網(wǎng)絡(luò)高級(jí)副總裁 Gilad Shainer 表示:

“生成式 AI 等開(kāi)創(chuàng)性技術(shù)的飛速發(fā)展,使每家企業(yè)都必須把網(wǎng)絡(luò)創(chuàng)新放在第一位,從而獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。NVIDIA Spectrum-X 是對(duì)以太網(wǎng)絡(luò)的一次革命,讓企業(yè)能夠充分利用其 AI 基礎(chǔ)設(shè)施的強(qiáng)大力量來(lái)改變其運(yùn)營(yíng)方式,甚至顛覆他們的行業(yè)。”

Scaleway 首席執(zhí)行官 Damien Lucas 表示:

“NVIDIA Spectrum-X 網(wǎng)絡(luò)技術(shù)為我們的‘GPU 集群按需服務(wù)’提供了更快的網(wǎng)絡(luò)連接和更高效的 GPU 通信,使我們的客戶能夠加速開(kāi)發(fā)和部署他們的 AI 解決方案。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5258

    瀏覽量

    105852
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34407

    瀏覽量

    275682
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3926

    瀏覽量

    93190

原文標(biāo)題:應(yīng)用 NVIDIA Spectrum-X 網(wǎng)絡(luò)構(gòu)建新型主權(quán) AI 云

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語(yǔ)言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與提供商,共同優(yōu)化主權(quán)大語(yǔ)言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級(jí) AI
    的頭像 發(fā)表于 06-12 15:42 ?123次閱讀

    NVIDIA推出全新硅光網(wǎng)絡(luò)交換機(jī)

    NVIDIA 今天推出了 NVIDIA Spectrum-XNVIDIA Quantum-X 硅光
    的頭像 發(fā)表于 03-20 14:52 ?415次閱讀

    NVIDIA 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    存儲(chǔ)提供商構(gòu)建搭載 AI 查詢(xún)智能體的基礎(chǔ)設(shè)施,利用 NVIDIA 計(jì)算、網(wǎng)絡(luò)和軟件,針對(duì)復(fù)雜查詢(xún)進(jìn)行推理并快速生成準(zhǔn)確響應(yīng) ? 美國(guó)加利福尼亞州圣何塞 —— GTC —— 太平洋時(shí)間
    發(fā)表于 03-19 10:11 ?206次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 <b class='flag-5'>AI</b> 時(shí)代的<b class='flag-5'>新型</b>企業(yè)基礎(chǔ)設(shè)施

    Evo 2 AI模型可通過(guò)NVIDIA BioNeMo平臺(tái)使用

    Evo 2 是一個(gè)強(qiáng)大的新型 AI 模型,它基于亞馬遜科技(AWS)上的 NVIDIA DGX Cloud 構(gòu)建而成,能夠幫助用戶深入了解
    的頭像 發(fā)表于 02-28 09:57 ?637次閱讀

    NVIDIA Spectrum-X網(wǎng)絡(luò)平臺(tái)助力提升AI存儲(chǔ)性能

    AI 工廠依靠的不僅僅是計(jì)算網(wǎng)。當(dāng)然,連接 GPU 的東西向網(wǎng)絡(luò)對(duì)于 AI 應(yīng)用的性能至關(guān)重要,而連接高速存儲(chǔ)陣列的存儲(chǔ)網(wǎng)也不容忽視。存儲(chǔ)性能在運(yùn)行 AI 業(yè)務(wù)過(guò)程中的多個(gè)階段中發(fā)揮著
    的頭像 發(fā)表于 02-15 11:01 ?631次閱讀

    利用NVIDIA DPF引領(lǐng)DPU加速計(jì)算的未來(lái)

    越來(lái)越多的企業(yè)開(kāi)始采用加速計(jì)算,從而滿足生成式 AI、5G 電信和主權(quán)的需求。NVIDIA 推出了 DOCA 平臺(tái)框架(DPF),該框架提供了基礎(chǔ)
    的頭像 發(fā)表于 01-24 09:29 ?612次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領(lǐng)DPU加速<b class='flag-5'>云</b>計(jì)算的未來(lái)

    NVIDIA與軟銀集團(tuán)合作加速日本主權(quán)AI計(jì)劃

    NVIDIA 宣布與軟銀集團(tuán)開(kāi)展一系列合作,旨在加速日本主權(quán) AI 計(jì)劃,并進(jìn)一步提升日本在全球的技術(shù)領(lǐng)先優(yōu)勢(shì),同時(shí)為全球電信運(yùn)營(yíng)商開(kāi)辟數(shù)十億美元的 AI 收入來(lái)源。
    的頭像 發(fā)表于 11-19 15:49 ?701次閱讀

    NVIDIA向開(kāi)放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開(kāi)放計(jì)算項(xiàng)目(OCP),并擴(kuò)大 NVIDIA Sp
    的頭像 發(fā)表于 11-19 15:30 ?566次閱讀

    如何構(gòu)建及優(yōu)化GPU網(wǎng)絡(luò)

    并從計(jì)算節(jié)點(diǎn)成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-06 16:03 ?889次閱讀
    如何<b class='flag-5'>構(gòu)建</b>及優(yōu)化GPU<b class='flag-5'>云</b><b class='flag-5'>網(wǎng)絡(luò)</b>

    NVIDIA SuperNIC推進(jìn)現(xiàn)代AI基礎(chǔ)設(shè)施發(fā)展

    在生成式 AI 時(shí)代,加速網(wǎng)絡(luò)對(duì)于為大規(guī)模分布式 AI 工作負(fù)載構(gòu)建高性能計(jì)算平臺(tái)至關(guān)重要。NVIDIA 在加速
    的頭像 發(fā)表于 11-06 13:59 ?664次閱讀

    NVIDIA助力xAI打造全球最大AI超級(jí)計(jì)算機(jī)

    NVIDIA 宣布,xAI 位于田納西州孟菲斯市的Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬(wàn)顆 NVIDIA Hopper GPU 的巨大規(guī)模。該集群使用了NVIDIA Spectru
    的頭像 發(fā)表于 10-30 11:38 ?756次閱讀

    NVIDIA Colossus超級(jí)計(jì)算機(jī)集群突破10萬(wàn)顆Hopper GPU

    的強(qiáng)大實(shí)力。 Colossus集群不僅規(guī)模龐大,更采用了NVIDIA Spectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺(tái)。該平臺(tái)專(zhuān)為多租戶、超大規(guī)模的AI工廠打造,提供了卓越的RDMA(遠(yuǎn)程直接內(nèi)存訪
    的頭像 發(fā)表于 10-30 10:29 ?579次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    市的 Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬(wàn)顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)
    發(fā)表于 10-30 09:33 ?303次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 xAI <b class='flag-5'>構(gòu)建</b>的全球最大 <b class='flag-5'>AI</b> 超級(jí)計(jì)算機(jī)

    NVIDIA新增生成式AI就緒系統(tǒng)認(rèn)證類(lèi)別

    借助全新的 NVIDIA Spectrum-X Ready 和 NVIDIA IGX 認(rèn)證,領(lǐng)先的制造業(yè)合作伙伴將提供高性能系統(tǒng),幫助客戶輕松部署 AI
    的頭像 發(fā)表于 10-10 09:44 ?696次閱讀

    簡(jiǎn)單認(rèn)識(shí)NVIDIA網(wǎng)絡(luò)平臺(tái)

    NVIDIA Spectrum-X800 平臺(tái)是業(yè)界第一代 800Gb/s 的以太網(wǎng)網(wǎng)絡(luò)平臺(tái),包括了 NVIDIA Spectrum SN5
    的頭像 發(fā)表于 09-09 09:22 ?746次閱讀
    主站蜘蛛池模板: 四虎国产成人亚洲精品 | 欧美高清成人 | 国产精品欧美激情在线播放 | 男人边吃奶边做视频免费网站 | 国产色视频网站免费观看 | 亚洲综合色色图 | 色播欧美| 天天干天天干天天干 | 男人j进女人j的视频一进一出 | 国产激情久久久久影院小草 | 来吧成人综合网 | 亚洲狠狠婷婷综合久久久久图片 | 日本黄页网站在线观看 | 狠狠色丁香久久婷婷综合丁香 | 人人操天天射 | 国产美女被艹 | 国产伦精品一区二区三区女 | 天天看天天摸天天操 | 激情狠狠干 | 亚洲日本高清 | 日本黄色视屏 | 午夜福免费福利在线观看 | 第四色亚洲 | 欧美一级视频在线观看欧美 | 天天爽夜夜爽8888视频精品 | 天天插视频| 伊人天堂在线 | 色多多免费观看在线 | avtt加勒比手机版天堂网 | 日本暴力喉深到呕吐hd | 色哟永久免费 | 女人色视频 | 亚洲国产成人精品青青草原100 | 黄字幕网 | 快色视频在线观看 | 午夜免费在线观看 | 国产福利小视频在线观看 | 精品四虎免费观看国产高清 | 欧美黄免在线播放 | 亚洲精品视频在线 | 国产三级国产精品 |