在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于分布式光交換的高帶寬域架構(gòu)InfiniteHBD

曦智科技 ? 來源:曦智科技 ? 2025-06-09 10:38 ? 次閱讀

曦智科技聯(lián)合北京大學(xué)、階躍星辰為下一代萬億參數(shù)大模型訓(xùn)練的基礎(chǔ)設(shè)施建設(shè)提出全新解決方案。

隨著大模型參數(shù)規(guī)模的擴(kuò)大,分布式訓(xùn)練成為人工智能發(fā)展的核心途徑。分布式訓(xùn)練可以將模型數(shù)據(jù)分配給多個計算節(jié)點(diǎn),進(jìn)行并行計算和數(shù)據(jù)管理,從而顯著加速模型訓(xùn)練的過程,而高帶寬域(High Bandwidht Domain, HBD)的設(shè)計對提升模型算力利用率至關(guān)重要。

然而,現(xiàn)有的HBD架構(gòu)在可擴(kuò)展性、成本和容錯能力等方面存在根本性限制:

交換機(jī)中心的HBD(如NVIDIA NVL72)成本高昂、不易擴(kuò)展規(guī)模。

以以AI 加速器(包括GPU 與專用ASIC)為中心的HBD(如Google TPUv3和Tesla Dojo)存在嚴(yán)重的故障傳播問題。

2022 年Google發(fā)布TPU v4 集群,首次采用光交換方案(Optical Circuit Switch,以下簡稱“OCS”),這種交換機(jī)-GPU混合的HBD在互連成本與系統(tǒng)擴(kuò)展性之間采取了折中方案,但仍存在故障爆炸半徑問題,其成本和容錯能力仍不甚理想。

70f2da02-41b9-11f0-b715-92fbcf53809c.jpg

在此背景下,曦智科技聯(lián)手北京大學(xué)、階躍星辰的研究團(tuán)隊提出了一種以光交換(OCS)模組為中心的高帶寬域架構(gòu)InfiniteHBD,通過在光電轉(zhuǎn)換模組中集成OCS能力,InfiniteHBD實(shí)現(xiàn)了動態(tài)可重構(gòu)的單點(diǎn)對多點(diǎn)連接,具備節(jié)點(diǎn)級故障隔離和低資源碎片化的能力。

InfiniteHBD在可擴(kuò)展性和成本上全面優(yōu)于現(xiàn)有方案:InfiniteHBD的單位成本僅為NVL72的31%,GPU冗余率比NVL72和TPUv4低一個數(shù)量級,且與NVIDIA DGX(單機(jī)8卡)相比,模型算力利用率最高提升3.37 倍。

該方案以論文形式被國際通信網(wǎng)絡(luò)領(lǐng)域頂級會議SIGCOMM 2025[1]接收。

曦智科技在集成硅光領(lǐng)域擁有十余年的產(chǎn)業(yè)經(jīng)驗(yàn),在InfiniteHBD 方案中,創(chuàng)新性的開發(fā)了基于硅光子技術(shù)的分布式光交換dOCS(distributed Optical Circuit Switch),將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉(zhuǎn)換模組中,大幅簡化了器件結(jié)構(gòu)的同時,有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD 的性價比和系統(tǒng)可擴(kuò)展性。

715fa696-41b9-11f0-b715-92fbcf53809c.png

分布式光交換方案對于建設(shè)超大規(guī)模訓(xùn)練集群具有以下收益:

dOCS自帶光電轉(zhuǎn)換,提供交換能力的同時可形成跨機(jī)超節(jié)點(diǎn);

光交換芯片采用成熟制程,降低了對于先進(jìn)制程電交換芯片的依賴;

光交換芯片對協(xié)議不敏感,適用于當(dāng)前GPU連接協(xié)議碎片化的現(xiàn)狀

InfiniteHBD為高帶寬域架構(gòu)的高效擴(kuò)展提供了新的解決方案,為下一代萬億參數(shù)大模型訓(xùn)練的基礎(chǔ)設(shè)施建設(shè)帶來了重要啟示。 注釋: [1]SIGCOMM,Special Interest Group on Data Communication,即數(shù)據(jù)通信專業(yè)組,是ACM(美國計算機(jī)協(xié)會)組織在通信網(wǎng)絡(luò)領(lǐng)域的旗艦會議。今年的SIGCOMM 將于9 月8日-11日在葡萄牙科英布拉舉行。

關(guān)于曦智科技

曦智科技是全球領(lǐng)先的光電混合算力提供商。公司憑借在集成光子領(lǐng)域的開創(chuàng)性技術(shù)和全球頂尖的集成電路技術(shù)研發(fā)團(tuán)隊,致力于在計算需求爆發(fā)的時代,為客戶提供一系列算力躍遷解決方案,與客戶共建更智能、更可持續(xù)的世界。曦智科技從光子矩陣計算(oMAC)、片上光網(wǎng)絡(luò)(oNOC)和片間光網(wǎng)絡(luò)(oNET)三大核心技術(shù)出發(fā),打造光子計算和光子網(wǎng)絡(luò)兩大產(chǎn)品線,與大數(shù)據(jù)、云計算、金融、自動駕駛、生物醫(yī)藥、材料研究等領(lǐng)域客戶開展緊密合作,持續(xù)為客戶提供更具創(chuàng)造性的高效算力支撐。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    825

    瀏覽量

    38978
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1165

    瀏覽量

    15500
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3060

    瀏覽量

    3894

原文標(biāo)題:曦科技|基于分布式光交換高帶寬域InfiniteHBD:破局超節(jié)點(diǎn)擴(kuò)展瓶頸

文章出處:【微信號:曦智科技,微信公眾號:曦智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    分布式伏電力問題層出不窮?安科瑞分布式伏運(yùn)維系統(tǒng)來“救場”

    分布式伏電力運(yùn)維,痛點(diǎn)大揭秘? ? 分布式伏作為實(shí)現(xiàn)綠色能源轉(zhuǎn)型的關(guān)鍵環(huán),近年來在我國
    的頭像 發(fā)表于 05-07 17:14 ?181次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運(yùn)維系統(tǒng)來“救場”

    分布式伏發(fā)運(yùn)維系統(tǒng)實(shí)際應(yīng)用案例分享

    和可持續(xù)發(fā)展的重要推動力量。國家能源局于2025年1月發(fā)布了《分布式伏發(fā)電開發(fā)建設(shè)管理辦法》,對分布式伏的分類、上網(wǎng)模式、備案管理、電網(wǎng)接入等進(jìn)行了詳細(xì)規(guī)定,未來
    的頭像 發(fā)表于 04-09 14:46 ?268次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發(fā)運(yùn)維系統(tǒng)實(shí)際應(yīng)用案例分享

    分布式伏運(yùn)維困境如何破?安科瑞伏運(yùn)維云平臺來支招

    分布式伏的發(fā)展與現(xiàn)狀 ? 在全球積極推進(jìn)清潔能源轉(zhuǎn)型的大背景下,分布式伏作為一種綠色、高
    的頭像 發(fā)表于 03-24 14:38 ?324次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運(yùn)維困境如何破?安科瑞<b class='flag-5'>光</b>伏運(yùn)維云平臺來支招

    分布式伏如何實(shí)現(xiàn)防逆流?

    分布式伏如何實(shí)現(xiàn)防逆流
    的頭像 發(fā)表于 03-24 13:31 ?224次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏如何實(shí)現(xiàn)防逆流?

    淺談分布式伏系統(tǒng)在工業(yè)企業(yè)的設(shè)計及應(yīng)用

    主要對工業(yè)廠區(qū)屋頂分布式伏發(fā)電系統(tǒng)的設(shè)計及應(yīng)用進(jìn)行研究,為工業(yè)廠區(qū)能源供應(yīng)提供一種全新的解決思路和技術(shù)支持。介紹了工業(yè)廠區(qū)屋頂分布式伏系
    的頭像 發(fā)表于 03-21 14:24 ?383次閱讀
    淺談<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統(tǒng)在工業(yè)企業(yè)的設(shè)計及應(yīng)用

    分布式伏如何重塑社區(qū)能源生態(tài)

    1概述 ? ? ? ?分布式伏系統(tǒng)是一種伏發(fā)電設(shè)備分散安裝在用戶側(cè)或負(fù)荷中心附近的發(fā)電系統(tǒng)。與集中式伏電站不同,
    的頭像 發(fā)表于 03-17 14:17 ?294次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏如何重塑社區(qū)能源生態(tài)

    基于ptp的分布式系統(tǒng)設(shè)計

    。 PTP概述 PTP是一種網(wǎng)絡(luò)時間同步協(xié)議,它允許網(wǎng)絡(luò)中的設(shè)備同步它們的時鐘。PTP基于IEEE 1588標(biāo)準(zhǔn),旨在提供亞微秒級別的時間同步精度。PTP通過在網(wǎng)絡(luò)中傳播時間信息,并使用這些信息來校正本地時鐘,從而實(shí)現(xiàn)精確的時間同步。 系統(tǒng)架構(gòu) 基于PTP的
    的頭像 發(fā)表于 12-29 10:09 ?493次閱讀

    分布式控及SOA架構(gòu)車身功能測試方案

    北匯信息推出分布式控以及SOA架構(gòu)的車身功能測試解決方案,支持在實(shí)驗(yàn)室環(huán)境下完成車身單部件、系統(tǒng)級功能自動化測試,可以極大地提升車身功能的可靠性和穩(wěn)定性。
    的頭像 發(fā)表于 12-27 09:05 ?2524次閱讀
    <b class='flag-5'>分布式</b>、<b class='flag-5'>域</b>控及SOA<b class='flag-5'>架構(gòu)</b>車身功能測試方案

    分布式伏監(jiān)控系統(tǒng)在能源領(lǐng)域中的重要性

    在當(dāng)今能源領(lǐng)域,分布式伏發(fā)電作為一種可持續(xù)的能源解決方案正日益普及。而分布式伏監(jiān)控系統(tǒng)在其中扮演著至關(guān)重要的角色,為
    的頭像 發(fā)表于 12-09 14:39 ?690次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監(jiān)控系統(tǒng)在能源領(lǐng)域中的重要性

    分布式伏為企業(yè)帶來哪些便捷!

    伏開發(fā)試點(diǎn)方案的通知》中指出:“為加快推進(jìn)屋頂分布式伏發(fā)展,擬在全國組織開展整縣(市、區(qū))推進(jìn)屋頂分布式伏開發(fā)試點(diǎn)工作”?
    的頭像 發(fā)表于 11-18 15:34 ?707次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏為企業(yè)帶來哪些便捷!

    淺談屋頂分布式伏發(fā)電技術(shù)的設(shè)計與應(yīng)用

    【摘要】為了緩解城市用電緊張袁降低人們的用電成本,可以在工業(yè)園區(qū)、辦公樓屋頂?shù)葓鏊鶓?yīng)用屋頂分布式伏發(fā)電技術(shù)進(jìn)行就近轉(zhuǎn)換、并網(wǎng)發(fā)電袁充分利用建筑物屋頂?shù)奶栙Y源。概述屋頂分布式伏發(fā)電
    的頭像 發(fā)表于 11-11 15:10 ?1749次閱讀
    淺談屋頂<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發(fā)電技術(shù)的設(shè)計與應(yīng)用

    文講清什么是分布式云化數(shù)據(jù)庫!

    分布式云化數(shù)據(jù)庫是一種先進(jìn)的數(shù)據(jù)管理系統(tǒng),它將傳統(tǒng)的數(shù)據(jù)庫技術(shù)與分布式計算、云計算和大數(shù)據(jù)處理技術(shù)相融合。這種數(shù)據(jù)庫架構(gòu)旨在提供可用性、
    的頭像 發(fā)表于 10-14 10:06 ?449次閱讀

    安科瑞分布式伏監(jiān)控系統(tǒng)的應(yīng)用

    隨著“雙碳”目標(biāo)的提出,開發(fā)利用可再生能源已成為必然趨勢。新能源發(fā)電作為能源利用的一種重要形式,已經(jīng)受到越來越多的關(guān)注。相對于大容量、電壓、遠(yuǎn)距離輸送的集中發(fā)電方式,分布式伏具有容
    的頭像 發(fā)表于 08-14 08:41 ?561次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監(jiān)控系統(tǒng)的應(yīng)用

    分布式伏發(fā)電對低壓電網(wǎng)的影響與對策

    分布式伏發(fā)電作為一種新型的能源與能源的綜合利用模式,具有形式靈活、管理與運(yùn)行成本低廉等優(yōu)點(diǎn),在無噪聲、無空氣與水體污染的情況下,具有顯著的環(huán)保效益,對于優(yōu)化能源結(jié)構(gòu),實(shí)現(xiàn)節(jié)能減排,具有十分重要
    的頭像 發(fā)表于 07-31 09:25 ?1642次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發(fā)電對低壓電網(wǎng)的影響與對策

    安科瑞分布式伏系統(tǒng)在某重工企業(yè)18MW分布式伏中應(yīng)用

    2024年7月16日,江蘇省發(fā)改委發(fā)布《關(guān)于高質(zhì)量做好全省分布式伏接網(wǎng)消納的通知(征求意見稿)》,計劃大力支持分布式伏的發(fā)展! 1、未來分布式
    的頭像 發(fā)表于 07-19 11:30 ?799次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統(tǒng)在某重工企業(yè)18MW<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏中應(yīng)用
    主站蜘蛛池模板: 五月天婷五月天综合网在线 | 免费一级毛片在线播放不收费 | 啪啪日韩 | 午夜视频在线免费 | 四虎东方va私人影库在线观看 | 婷婷午夜| 天天爱天天做久久天天狠狼 | 女人张腿让男子桶免费动态图 | 四虎影院www | 激情六月丁香婷婷 | аⅴ资源天堂8在线 | 国产二区三区 | 日韩高清一级 | 4438x成人网全国最大 | 亚洲黄色高清视频 | 欧美深深色噜噜狠狠yyy | 午夜在线播放视频 | 成人国产精品一级毛片了 | 夜夜爽一区二区三区精品 | 国内精品一区二区在线观看 | 三级黄色在线视频中文 | 天堂伊人| www.色多多| 91大神精品全国在线观看 | 午夜看片影院在线观看 | 九九免费久久这里有精品23 | 国产精品高清久久久久久久 | 色偷偷男人天堂 | 天天干天天干天天干天天 | 波多野结衣在线观看一区二区三区 | 全黄色一级片 | 日韩乱轮| 天天操天天干天天爱 | 性欧美高清精品videos | 欧美怡红院免费全部视频 | 午夜看一级特黄a大片 | 六月色播| 国内黄色录像 | 色吧首页dvd | 视频综合网 | 日韩欧美伦理 |