在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全新NVIDIA Spectrum-X網(wǎng)絡(luò)平臺構(gòu)筑阿里生成式AI云底座

麗臺科技 ? 來源:麗臺科技 ? 2023-11-02 09:07 ? 次閱讀

全新 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺構(gòu)筑阿里生成式 AI 云底座。

a409b7e6-7913-11ee-939d-92fbcf53809c.png

隨著生成式 AI 的熱潮席卷全球,用于訓(xùn)練生成式 AI 的大型高性能網(wǎng)絡(luò)基礎(chǔ)設(shè)施開始受到客戶和行業(yè)的關(guān)注。這不僅僅是因?yàn)榫薮蟮氖袌鰸摿Γ驗(yàn)樯墒?AI 應(yīng)用對當(dāng)前網(wǎng)絡(luò)的技術(shù)與產(chǎn)品帶來的巨大挑戰(zhàn)。

由于生成式 AI 訓(xùn)練任務(wù)的特性,其對網(wǎng)絡(luò)的要求與傳統(tǒng)的 DC 網(wǎng)絡(luò)在多方面存在差異。主要體現(xiàn)在:

性能至上,對于網(wǎng)絡(luò)帶寬及通信效率的要求高,需要實(shí)現(xiàn)從 GPU 到網(wǎng)絡(luò),再到其它 GPU 的端到端帶寬平衡,從而達(dá)到充分發(fā)揮集群訓(xùn)練性能的目的。

AI 網(wǎng)絡(luò)流量并發(fā)性高和突發(fā)性流量多,對于數(shù)據(jù)的完整性要求很高,依賴于 RDMA 轉(zhuǎn)發(fā)保證帶寬最大化和數(shù)據(jù)的完整性,降低對 CPU 資源消耗。

模型并行加數(shù)據(jù)并行共存的通信機(jī)制導(dǎo)致對于網(wǎng)絡(luò)時延敏感,網(wǎng)絡(luò)中的任何額外的時延都可能影響數(shù)以百計的 GPU 之間的通信效率。

需要無收斂的網(wǎng)絡(luò)拓?fù)浔WC各種通信場景下的網(wǎng)絡(luò)帶寬沒有瓶頸。

由于傳統(tǒng)的網(wǎng)絡(luò)解決方案無法滿足這些需求,NVIDIA 依靠多年在 AI 和高速通信領(lǐng)域的積累,推出了 Spectrum-X 以太網(wǎng)解決方案,以推動以太網(wǎng)技術(shù)可以更好地適配生成式 AI 基礎(chǔ)設(shè)施的要求。

NVIDIA Spectrum-X 是專為基于以太網(wǎng)的 AI 云提高性能和效率而設(shè)計的平臺。

NVIDIA Spectrum-X 依托于 NVIDIA Spectrum-4 以太網(wǎng)交換機(jī)和 NVIDIA BlueField-3 DPU 的緊密結(jié)合,專為 AI 工作負(fù)載構(gòu)建了端到端的創(chuàng)新網(wǎng)絡(luò)平臺,大幅提升了以太網(wǎng)在大規(guī)模、可擴(kuò)展環(huán)境中的通信效率,并在多租戶環(huán)境中實(shí)現(xiàn)了一致的、可預(yù)測的性能,提高了生成式 AI 云的性能和能效。NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺還包括 Cumulus Linux、NetQ、Air 和 DOCA 加速軟件等,以及 NVIDIA 的 LinkX 系列線纜和光模塊產(chǎn)品,共同助力該網(wǎng)絡(luò)平臺實(shí)現(xiàn)出色的性能。

NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺集成了 NVIDIA Spectrum-4 以太網(wǎng)交換機(jī)、NVIDIA BlueField-3 DPU、NVIDIA LinkX 線纜及加速軟件和 SDK,通過無損以太網(wǎng)的端到端動態(tài)路由、基于可編程擁塞控制的性能隔離技術(shù)等先進(jìn)的 RoCE 擴(kuò)展功能,構(gòu)建了一個專為 AI 云而優(yōu)化和加速的端到端高性能 400GbE 以太網(wǎng)絡(luò)。測試顯示,與傳統(tǒng)以太網(wǎng)相比,采用 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺可將大規(guī)模 AI 工作負(fù)載的性能提高到 1.7 倍,并將網(wǎng)絡(luò)的有效通信帶寬提升到 1.6 倍。

NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺,實(shí)現(xiàn)了 GPU 到 GPU 直接的端到端加速和優(yōu)化,大幅減少了大規(guī)模生成式 AI 模型的運(yùn)行時間,提升了 GPU 的效率,優(yōu)化了 AI 平臺的總體擁有成本(TCO)和降低了基礎(chǔ)設(shè)施的整體功耗。同時,它還具有高度的通用性,有力地支撐了各種生成式 AI 應(yīng)用,由于它也是標(biāo)準(zhǔn)的以太網(wǎng),實(shí)現(xiàn)了與已有的基于以太網(wǎng)堆棧的云架構(gòu)和云服務(wù)互通。

阿里云作為全球領(lǐng)先的云供應(yīng)商,擁有巨型的通用計算平臺。同時,阿里云也持續(xù)向加速計算領(lǐng)域擴(kuò)張,建成并持續(xù)擴(kuò)張以PAI 靈駿”算力服務(wù)為代表大型的 GPU 集群。阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)從 2017 年開始構(gòu)建端網(wǎng)融合的可預(yù)期高性能 RDMA 網(wǎng)絡(luò)架構(gòu),過去幾年已經(jīng)在高性能存儲領(lǐng)域?qū)崿F(xiàn)了大規(guī)模部署,目前正在大規(guī)模 AI 計算領(lǐng)域持續(xù)創(chuàng)新迭代和規(guī)模部署,以適配 AI 計算對高性能網(wǎng)絡(luò)的訴求。阿里云也充分認(rèn)識到技術(shù)創(chuàng)新對以太網(wǎng)方案持續(xù)支持高性能網(wǎng)絡(luò),尤其是生成式 AI 基礎(chǔ)設(shè)施的重要性。

為此,阿里云聯(lián)合 NVIDIA 對 Spectrum-X 解決方案進(jìn)行測試,以評估新技術(shù)對高性能網(wǎng)絡(luò)的適應(yīng)能力。

測試的主要內(nèi)容和結(jié)果

阿里云測試環(huán)境配置

測試環(huán)境使用了 2 臺 Spine 交換機(jī),4 臺 ToR 交換機(jī),16 臺 HGX GPU 服務(wù)器并配置了 NVIDIA BlueField-3 DPU,基于 NVIDIA 51.2T Spectrum-4 交換芯片的 SN5600,以太網(wǎng)交換機(jī),支持 128*400G 或者 64*800G 端口。每臺 GPU 服務(wù)器配置 8 張 BlueField-3 DPU,每 4 臺 GPU 服務(wù)器為一組連接到一臺 ToR 交換機(jī),共 4 組連接到 4 臺 ToR 交換機(jī)。ToR 交換機(jī)通過 200G 網(wǎng)絡(luò)連接到 BlueField-3 DPU,4 臺 ToR 交換機(jī)通過 2 臺 Spine 交換機(jī)連接在一起,構(gòu)成無阻塞胖樹網(wǎng)絡(luò)。

a42367d6-7913-11ee-939d-92fbcf53809c.png

主要的測試內(nèi)容

這些測試由多個級別的工作負(fù)載組成,從簡單到復(fù)雜:

RDMA 基準(zhǔn)性能測試,覆蓋帶寬和延遲。

孤立場景下的 All to All 和 All Reduce 集合通信測試,專注于 NCCL 性能基準(zhǔn)。

在共享資源和有背景噪聲環(huán)境下的性能測試。

故障場景的測試。

a442808a-7913-11ee-939d-92fbcf53809c.png

測試結(jié)果顯示,由于使用了端到端的逐包負(fù)載均衡優(yōu)化技術(shù)(Adaptive Routing)和零配置 RoCE 擁塞控制(ZTR CC)使得網(wǎng)絡(luò)利用率顯著提升,并顯著減少由于網(wǎng)絡(luò)擁塞和 In-Cast 問題帶來的時延和抖動。網(wǎng)絡(luò)帶寬利用率在各種測試場景下均可超過 90%。這種逐包負(fù)載均衡技術(shù)也可以對多種故障情況(本端和遠(yuǎn)端)做出響應(yīng),合理地利用網(wǎng)絡(luò)內(nèi)的帶寬資源。在真實(shí)訓(xùn)練任務(wù)的測試過程中,Spectrum-X 可以降低 20% 以上的訓(xùn)練時間。在獲得這一切收益的同時,網(wǎng)絡(luò)的配置工作量大大降低,運(yùn)維人員不再需要進(jìn)行復(fù)雜的配置和頻繁的調(diào)優(yōu)工作。

這些測試結(jié)果表明 NVIDIA Spectrum-X 加速網(wǎng)絡(luò)平臺的突破性技術(shù)可大幅提升大規(guī)模生成式 AI 工作負(fù)載的性能,并大幅縮短生成式 AI 模型的運(yùn)行時間。

通過采用 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺,客戶可進(jìn)一步為千行百業(yè)的客戶提供具有性能和成本優(yōu)勢的生成式 AI 云服務(wù),將 AI 通用大模型和行業(yè)大模型賦能和融合各種應(yīng)用場景。NVIDIA 和阿里云的開發(fā)人員將基于 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺的加速軟件和 SDK 進(jìn)一步在虛擬化、定制化可編程擁塞控制、遙測、快速故障響應(yīng)等方面展開合作,推動這一新解決方案的進(jìn)一步發(fā)展和應(yīng)用。

針對這一聯(lián)合測試,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)研發(fā)事業(yè)部總經(jīng)理蔡德忠表示:“高性能網(wǎng)絡(luò)技術(shù)是 AI 計算 Scaling Law 的關(guān)鍵所在,這個領(lǐng)域需要持續(xù)不斷的創(chuàng)新迭代,阿里云始終堅(jiān)持網(wǎng)絡(luò)的開放性,也是網(wǎng)絡(luò)開源生態(tài)的領(lǐng)導(dǎo)者和積極貢獻(xiàn)者,阿里云與 NVIDIA 在 AI 計算和高性能存儲領(lǐng)域合作多年,將持續(xù)探索創(chuàng)新基于 Open Ethernet 的高性能網(wǎng)絡(luò)方案,助力 AI 計算集群的大規(guī)模高效擴(kuò)展。”

NVIDIA 網(wǎng)絡(luò)高級副總裁 Gilad Shainer表示:“生成式 AI(Generative AI)是面向下一代業(yè)務(wù)需求的典型代表,為了支撐成千上萬的用戶的需求,生成式 AI 云需要先進(jìn)及可靠的網(wǎng)絡(luò)基礎(chǔ)架構(gòu)滿足各種 AI 業(yè)務(wù)的平滑增長。阿里云和 NVIDIA 在 Spectrum-X 以太網(wǎng)平臺上的策略合作,可以充分利用 Spectrum-X 的先進(jìn)路由技術(shù)和云上業(yè)務(wù)性能隔離技術(shù),使阿里云及其廣大用戶可以盡情享受生成式 AI 的服務(wù)。”






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5605

    瀏覽量

    175116
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5274

    瀏覽量

    105925
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    21

    文章

    2728

    瀏覽量

    101544
  • 光模塊
    +關(guān)注

    關(guān)注

    80

    文章

    1403

    瀏覽量

    60127
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    305

    瀏覽量

    6147

原文標(biāo)題:全新 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺構(gòu)筑阿里生成式 AI 云底座

文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA推出全新硅光網(wǎng)絡(luò)交換機(jī)

    NVIDIA 今天推出了 NVIDIA Spectrum-XNVIDIA Quantum-X 硅光
    的頭像 發(fā)表于 03-20 14:52 ?434次閱讀

    NVIDIA Spectrum-X網(wǎng)絡(luò)平臺助力提升AI存儲性能

    AI 工廠依靠的不僅僅是計算網(wǎng)。當(dāng)然,連接 GPU 的東西向網(wǎng)絡(luò)對于 AI 應(yīng)用的性能至關(guān)重要,而連接高速存儲陣列的存儲網(wǎng)也不容忽視。存儲性能在運(yùn)行 AI 業(yè)務(wù)過程中的多個階段中發(fā)揮著
    的頭像 發(fā)表于 02-15 11:01 ?643次閱讀

    科技榮獲亞馬遜科技生成AI能力認(rèn)證

    助力企業(yè)加速生成AI應(yīng)用落地 北京2025年2月14日?/美通社/ -- 管理服務(wù)提供商聚科技獲得亞馬遜
    的頭像 發(fā)表于 02-14 16:07 ?346次閱讀

    巨人網(wǎng)絡(luò)阿里深化AI合作

    基礎(chǔ),巨人網(wǎng)絡(luò)阿里此次深化合作,旨在探索AI在游戲領(lǐng)域的更多可能性。巨人網(wǎng)絡(luò)表示,公司正在積極研究A
    的頭像 發(fā)表于 02-14 14:06 ?526次閱讀

    NVIDIA Omniverse擴(kuò)展至生成物理AI領(lǐng)域

    NVIDIA近日宣布,其Omniverse?平臺再次實(shí)現(xiàn)重大突破,成功推出多個生成AI模型和藍(lán)圖,將Omniverse的應(yīng)用范圍進(jìn)一步擴(kuò)展
    的頭像 發(fā)表于 01-13 10:56 ?727次閱讀

    NVIDIA 推出高性價比的生成 AI 超級計算機(jī)

    Jetson Orin Nano Super 可將生成 AI 性能提升至1.7 倍,支持科技愛好者、開發(fā)者和學(xué)生使用的主流模型。 ? ? NVIDIA 推出了一款
    發(fā)表于 12-18 17:01 ?694次閱讀
    <b class='flag-5'>NVIDIA</b> 推出高性價比的<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 超級計算機(jī)

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了一個全新生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?779次閱讀

    NVIDIA向開放計算項(xiàng)目捐贈Blackwell平臺設(shè)計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎(chǔ)元素捐贈給開放計算項(xiàng)目(OCP),并擴(kuò)大 NVIDIA
    的頭像 發(fā)表于 11-19 15:30 ?582次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    Amdocs 是一家為通信和媒體提供商提供軟件與服務(wù)的領(lǐng)先供應(yīng)商。該公司構(gòu)建的 amAIz 特定領(lǐng)域生成 AI 平臺幫助電信公司深入改變了客戶體驗(yàn),實(shí)現(xiàn)了流程自動化,并優(yōu)化了決策。A
    的頭像 發(fā)表于 11-19 14:48 ?825次閱讀

    NVIDIA助力xAI打造全球最大AI超級計算機(jī)

    NVIDIA 宣布,xAI 位于田納西州孟菲斯市的Colossus 超級計算機(jī)集群達(dá)到了 10 萬顆 NVIDIA Hopper GPU 的巨大規(guī)模。該集群使用了NVIDIA Spectru
    的頭像 發(fā)表于 10-30 11:38 ?785次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機(jī)

    市的 Colossus 超級計算機(jī)集群達(dá)到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)
    發(fā)表于 10-30 09:33 ?320次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 <b class='flag-5'>AI</b> 超級計算機(jī)

    NVIDIA新增生成AI就緒系統(tǒng)認(rèn)證類別

    借助全新NVIDIA Spectrum-X Ready 和 NVIDIA IGX 認(rèn)證,領(lǐng)先的制造業(yè)合作伙伴將提供高性能系統(tǒng),幫助客戶輕松部署
    的頭像 發(fā)表于 10-10 09:44 ?713次閱讀

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成
    的頭像 發(fā)表于 09-09 09:37 ?765次閱讀

    簡單認(rèn)識NVIDIA網(wǎng)絡(luò)平臺

    NVIDIA Spectrum-X800 平臺是業(yè)界第一代 800Gb/s 的以太網(wǎng)網(wǎng)絡(luò)平臺,包括了 N
    的頭像 發(fā)表于 09-09 09:22 ?758次閱讀

    應(yīng)用NVIDIA Spectrum-X網(wǎng)絡(luò)構(gòu)建新型主權(quán)AI

    法國服務(wù)提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPU和 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺 構(gòu)建區(qū)域性 G
    的頭像 發(fā)表于 07-26 18:58 ?1439次閱讀
    主站蜘蛛池模板: 欧美高清一区二区三 | 国产人成高清视频观看 | 婷婷色爱区综合五月激情韩国 | 亚洲精品影视 | 国模吧2021新入口 | 黄色小视频免费看 | 中文一区在线 | 日本一区二区三区四区在线观看 | 男女交性视频免费播放 | 国产高清片 | 欧美熟色妇 | 人人爱爱 | 婷婷sese| 免费国产一区二区三区 | 国产成人福利夜色影视 | 国产精品一区牛牛影视 | 日本欧美一区二区三区不卡视频 | 天堂资源在线bt种子 | 国产一区二区三区 韩国女主播 | 亚洲爱爱网 | 热99精品| 韩国三级在线不卡播放 | 国产老头和美女在线观看 | 成人最新午夜免费视频 | 久久99久久99精品免观看 | 色噜噜中文网 | aaa级片| 免费污视频在线 | 天天澡天天摸天天添视频 | 欧美+日本+国产+在线观看 | 日本一本一道久久香蕉免费 | 日本国产高清色www视频在线 | 日韩成人免费观看 | 国产人人干| 色婷婷综合缴情综六月 | 天天操天天操天天操 | 亚洲天天做日日做天天看2018 | 包你爽综合网 | 国产高清一级视频在线观看 | 美女张开腿露出尿口让男人桶 | 久久影院朴妮唛 |