在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘智算中心的互聯技術決策

SDNLAB ? 來源:SDNLAB ? 2024-10-22 16:17 ? 次閱讀

作者:張景濤

英偉達設計的DGX H100 NVL256超級計算集群,原本計劃集成256個NVIDIA H100 GPU,但最終其在商業市場上卻難覓其蹤。這一現象引發了業界對其開發中止原因的廣泛討論。普遍觀點認為,主要障礙在于成本收益不成正比。該系統在連接GPU時大量使用光纖,導致BOM成本激增,超出了標準NVL8配置的經濟合理性范圍。

DGX H100 NVL256 SuperPOD

盡管英偉達聲稱擴展后的NVL256能夠為400B MoE訓練提供高達2倍的吞吐量。然而,大客戶經過計算分析,對英偉達的這一聲明表示懷疑。盡管最新代的NDR InfiniBand即將達到400Gbit/s的速度,而NVLink4則達到450GB/s,理論上提供了約9倍的峰值帶寬速度提升。該系統設計中使用了128個L1 NVSwitch和36個L2外部NVSwitch,形成了2:1的阻塞比,意味著每個服務器只能有一半的帶寬連接至另一服務器。英偉達依賴NVlink SHARP技術來優化網絡,以實現allToall帶寬的等效性。

H100 NVL256 成本分析

在Hot Chips 34會議上對H100 NVL256 BoM的分析表明,擴展NVLink256使得每個超級單元(SU)的BoM成本增加了約30%。當擴展到超過2048個H100 GPU時,由于需要從兩層InfiniBand網絡拓撲轉變為三層的網絡拓撲,InfiniBand的成本百分比增加,這一比例略有降低。

wKgaoWcXX8uAdZWxAAIxOUKNrSc915.png

圖2 NVL256成本分析

大客戶和超大規模計算公司對他們當前的工作負載進行了性能/總擁有成本(perf/TCO)分析,并得出結論:相比支付NVL256擴展NVLink的成本,額外花費30%購買更多的HGX H100服務器能獲得更好的性能/成本比。這一分析結果導致英偉達最終決定不推出DGX H100 NVL256產品。

GH200 NVL32 重新設計

隨后,英偉達對NVL256進行了重新設計,將其縮減至NVL32,并采用了銅背板spine,這與他們NVL36/NVL72 Blackwell設計相似。據悉,AWS已同意為其Project Ceiba項目購買16k GH200 NVL32。據估計,這種重新設計的NVL32的成本溢價將比標準高級HGX H100 BoM高出10%。隨著工作負載的持續增長,英偉達聲稱對于GPT-3 175B和16k GH200,NVL32的速度將比16k H100快1.7倍,在500B LLM推理上快2倍。這些性能/成本比對客戶來說更具吸引力,也使得更多客戶傾向于采用英偉達的這種新設計。

wKgZoWcXX8uAAYWxAAXMEx9XKM8066.png

圖3 GH200 NVL32

GB200 NVL72的突破

關于GB200 NVL72的預期推出,英偉達據信已經從H100 NVL256的失敗中吸取了教訓,轉而采用銅纜互連,稱為“NVLink spine”,以期解決成本問題。這種設計變更預計將降低商品成本(COG cost of goods),并為GB200 NVL72鋪平成功之路。英偉達聲稱,采用銅設計,NVL72的成本將節省約6倍,每個GB200 NVL72架可節省約20kW電力,每個GB200 NVL32架子節省約10kW。

與H100 NVL256不同,GB200 NVL72將不會在計算節點內使用任何NVLink switch,而是采用平坦軌道優化(flat rail-optimized)的網絡拓撲。對于每72個GB200 GPU,將有18個NVLink switch。由于所有連接都在同一機架內,最遠的連接只需跨越19U(0.83米),這在有源銅纜的范圍內是可行的。

wKgaoWcXX8uACsx-AAWd1dDp4dE095.png

圖4 GB200 NVL72架構

據Semianalysis報道,英偉達聲稱其設計可以支持在單個NVLink域內連接多達576個GB200 GPU。這可能通過增加額外的NVLink switch層來實現。預計英偉達將保持2:1的阻塞比,即在GB NVL576 SU內,將使用144個L1 NVLink switch加36個L2 NVLink switch?;蛘?,他們也可能采取更積極的1:4阻塞比,僅使用18個L2 NVLink switch。他們將繼續使用光學OSFP收發器來擴展從機架內的L1 NVLink switch到L2 NVLink switch的連接。

wKgaoWcXX8uAaUs6AAdGk6QeFcU122.png

圖5 GB200 NVL576架構

有傳言稱NVL36和NVL72已經占NVIDIA Blackwell交付量的20%以上。然而,對于大客戶是否會選擇成本更高的NVL576,這仍然是個問題,因為擴展到NVL576需要額外的光學器件成本。英偉達似乎已經吸取了教訓,認識到銅纜的互聯成本遠低于光纖器件。

專家觀點

其實對于到底該使用銅還是光,以及對NVL72的看法,半導體產業大神Doug O’Langhlin在其文章《The Data Center is the New Compute Unit:Nvidia's Vision for System-Level Scaling》也做了闡述:

銅纜互聯將在機架級取得統治地位,并且在用光之前要榨干銅的所有價值。

I conclude that Copper will reign supreme at the rack scale level and can push Moore’sLaw scaling further. AI networking aims to scale copper networking as hard as possible before we have to use Optics.

對于NVL72的前途,大神也相當看好,認為這是摩爾定律在機架級的體現:

It all starts with Moore’s Law. There is a profound beauty in semiconductors, as thesame problem that is happening at the chip scale is the same problem that is happening at the data center level. Moore’s Law is a fractal, and the principles that apply tonanometers apply to racks.

基于無源銅纜的nvlink域將是一個新的成功基準,并且具備更好的成本收益比。

The new Moore’s Law is about pushing the most compute into a rack. Also, looking at Nvidia’s networking moat as InfiniBand versus Ethernet is completely missing the entirepoint. I think the NVLink domain over passive copper is the new benchmark of success,and it will make a lot of sense to buy GB200 NV72 racks instead of just B200s.

業界視角

財通證券的研報《銅互聯,數據中心通信網絡重要解決方案》也給出了自己的看法。研報中指出:

短距通信場景銅互聯相對優勢還是很明顯的,銅連接產品在數據中心高速互聯中一直扮演著重要角色。在數據中心能耗攀升,以及建設成本高企的背景下,銅互聯在散熱效率、低功耗、低成本方面有著一定優勢。伴隨Serdes 速率逐步從56G、112G 向224G升級,單端口速率將基于8 通道達到1.6T,高速傳輸成本有望大幅下降,對應銅纜速率也向著224Gbps 演進。為解決高速銅纜的傳輸損耗問題,AEC、ACC通過內置信號增強芯片提升傳輸距離,銅纜模組生產工藝也在同步升級。

wKgZoWcXX8uAYXwDAAggN16EAXg090.png

圖7 銅互聯在數據中心短距互聯中的重要角色

根據Light Counting,全球無源直連電纜DAC 和有源電纜AEC 的市場規模將分別以25%和45%的年復合增長率增長。

wKgZoWcXX8uAfieeAAJcsie1L90546.png

圖8 銅纜高速復合增長

2010 年至2022 年間,交換機芯片帶寬容量從640 Gbps 增長到了51.2 Tbps,80倍的帶寬增長帶來了22 倍的系統總功耗提升,其中光學元件功率(26 倍)的功耗提升尤為明顯。

wKgaoWcXX8uACtNlAAN_LRWCNtU117.png

圖9 光學器件功耗占比逐步提升

銅纜互聯由于不涉及光電轉化,因此具有低功耗特點,相比于有源光纜(AOC),目前的銅直接連接電纜(DAC)的功耗小于0.1 W,可以忽略不計,有源電纜(AEC)亦可將功耗控制在5w 以內,可在一定程度上降低算力集群整體功耗。

wKgaoWcXX8uAOUjYAAFObMKl-Ko919.png

圖10 功耗對比

在銅纜可觸達的高速信號傳輸距離內,相比光纖連接,銅連接方案的成本較低,此外,銅纜模組在短距離內可以提供極低延遲的電信號傳輸并具有高可靠性,不會出現光纖在某些環境下可能出現的信號丟失或干擾風險。同時,銅纜的物理特性使得它更易于處理和維護,并且其具有高兼容度并不需要額外的轉換設備。

wKgZoWcXX8uAWeEyAAEdAzgKVjk946.png

圖11 成本對比

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4777

    瀏覽量

    129360
  • 服務器
    +關注

    關注

    12

    文章

    9308

    瀏覽量

    86071
  • 英偉達
    +關注

    關注

    22

    文章

    3848

    瀏覽量

    91985
  • 智算中心
    +關注

    關注

    0

    文章

    72

    瀏覽量

    1817

原文標題:揭秘智算中心的互聯技術決策

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中心網絡架構選型原則

    ? 通常,在在AI智系統中,一個模型從生產到應用,一般包括離線訓練和推理部署兩大階段;本文選自“ 智中心網絡架構白皮書(2023) ”“ 智能計算中心規劃建設指南 ”,常用的對IB
    的頭像 發表于 08-07 09:13 ?2904次閱讀

    中心加速布局,上游計算、存儲、互聯都涉及哪些芯片技術

    電子發燒友網報道(文/李彎彎)智中心是承載人工智能計算需求的基礎設施,專門用于處理AI算法和模型所需的大量計算任務。與傳統的數據中心和超中心
    的頭像 發表于 07-24 01:13 ?4513次閱讀

    國資委發文鼓勵、Sora開年爆火…智中心的2024注定熱辣滾燙?

    中心Sora
    腦極體
    發布于 :2024年02月27日 16:11:19

    數據揭秘你不知道的阿里巴巴數據中心

    Alibaba Cluster Data 開源:270GB 數據揭秘你不知道的阿里巴巴數據中心
    發表于 04-30 09:37

    數據中心互聯解決方案

      數據中心互聯解決方案  隨著數據中心在全球的大規模部署,數據中心對于100Gbps模塊的需求時代已經到了,而對于10G/40Gbps模塊的需求依然強勁?! MC針對數據
    發表于 07-03 10:36

    中心,智慧時代的“發電站”

    如何讓計算力像電力一樣“普適普惠”,為整個社會所用?電廠是通過變電站解決最后一公里問題,智慧計算則要依靠邊緣數據中心。所以,智中心解決之道里,力、數據、
    的頭像 發表于 05-13 10:17 ?3571次閱讀

    華中最火爆的中心-中億云礦 帶你揭秘Chia挖礦的致富之道!

    如果問,21世紀你最關注的是什么?相信九成九的人都會脫口而出:搞錢!搞錢!搞錢!致富道路千萬條,而Chia幣就是近年來呼聲最高,被炒的最火的一條。今天,作為華中最火爆的中心——中億云礦就來為大家
    的頭像 發表于 06-17 15:03 ?3880次閱讀
    華中最火爆的<b class='flag-5'>算</b>力<b class='flag-5'>中心</b>-中億云礦 帶你<b class='flag-5'>揭秘</b>Chia挖礦的致富之道!

    北鯤云超與傳統超中心的區別

    隨著技術的進步和社會經濟的發展,高性能計算的基礎設施建設也在不斷擴大,出現了許多超級計算中心、云計算數據中心以及公有云廠商所建立的各種公有云平臺等不同形態的力基礎設施。而北鯤云超
    發表于 07-16 11:24 ?2076次閱讀

    基于華為云打造的成都智中心正式上線

    5月10日,“東數西” 國家一體化大數據中心成渝樞紐節點的樣板工程、西南地區最大的人工智能計算中心——成都智中心正式上線。
    的頭像 發表于 05-11 11:45 ?2772次閱讀

    如何定義AI中心新實踐

    9月3日上午, “盡其用·AI中心建設新實踐”云端AI力產業論壇在2022世界人工智能大會上隆重召開,來自人工智能力領域院士專家、
    發表于 09-05 10:48 ?1243次閱讀

    天數智芯與互聯公司簽署互聯網合作框架協議

    近日,上海天數力電子科技有限公司(以下簡稱“天數力”)與互聯(北京)科技有限公司(以下簡稱“
    的頭像 發表于 08-30 11:47 ?1473次閱讀

    云數據中心、智中心、超中心,有何區別?

    云數據中心、智中心和超中心是當前計算機領域中比較重要的研究方向,三者雖然都屬于數據中心的范疇
    的頭像 發表于 06-22 08:27 ?5676次閱讀
    云數據<b class='flag-5'>中心</b>、智<b class='flag-5'>算</b><b class='flag-5'>中心</b>、超<b class='flag-5'>算</b><b class='flag-5'>中心</b>,有何區別?

    壁仞科技為中國移動呼和浩特智中心提供強大

    中心提供強大力。該項目成功上線運營,標志著雙方在智能計算領域的深度合作邁出了堅實的步伐。 ? 中國移動智中心(呼和浩特)屬于全國型N節點萬卡訓練場,單體
    的頭像 發表于 07-05 17:16 ?1346次閱讀

    中心會取代通用中心嗎?

    隨著人工智能(AI)技術的飛速發展,計算需求不斷攀升,數據中心行業正經歷著前所未有的變革。傳統的通用中心與新興的智
    的頭像 發表于 01-06 14:45 ?179次閱讀
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>會取代通用<b class='flag-5'>算</b>力<b class='flag-5'>中心</b>嗎?

    中心力如何衡量?

    作為當下科技發展的重要基礎設施,其力的衡量關乎其能否高效支撐人工智能、大數據分析等智能應用的運行。以下是對智中心算力衡量的詳細闡述:一、力的基本定義與單位1、
    的頭像 發表于 01-16 14:03 ?475次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的<b class='flag-5'>算</b>力如何衡量?
    主站蜘蛛池模板: 日韩亚洲人成网站在线播放 | 四虎永久免费网站 | 午夜影视免费完整高清在线观看网站 | 精品亚洲欧美无人区乱码 | 午夜三级国产精品理论三级 | 毛片在线网 | 激情丁香网 | jk黑色丝袜美腿老师啪啪 | 男人和女人做爽爽视频在线观看 | 老师办公室高h文小说 | 热99在线视频 | 日韩免费网站 | 日本人xxxxxxxxx69| 日韩免费精品视频 | 国产馆精品推荐在线观看 | 毛片你懂的 | 国产婷婷色一区二区三区 | 男人资源网 | 久久久黄色片 | 国产精品福利午夜h视频 | 午夜一级| 午夜看片网 | 四虎影院黄色 | 最新激情网址 | 又粗又大撑满了好爽 | 国产一二精品 | 美女扒开尿口给男人捅 | 萌白酱香蕉白丝护士服喷浆 | 国产高清一区二区三区四区 | 看屁屁www视频免费观看 | 成人在线一区二区 | 国产综合视频在线 | 7799国产精品久久久久99 | 91九色蝌蚪在线 | 视频免费观看视频 | 天天艹夜夜 | 午夜影院免费观看视频 | 久久艹影院 | 全午夜免费一级毛片 | 日本免费黄色小视频 | 色综合亚洲天天综合网站 |