在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過NVIDIA Spectrum Ethernet的自適應路由加速網絡

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-08-15 16:00 ? 次閱讀

NVIDIA 加速 AI 平臺和產品(如 NVIDIA EGX 、 DGX 、 OVX 和 NVIDIA AI for Enterprise )需要數據中心網絡的最佳性能。 NVIDIA Spectrum Ethernet 平臺通過芯片級創新實現了這一性能。

融合以太網 RDMA 自適應路由( RoCE )通過減少網絡擁塞問題加快了應用程序的速度。這篇文章介紹了 NVIDIA 頻譜以太網的自適應路由技術,并提供了一些初步的性能基準。

是什么讓我的網絡變慢了?

您不必是云服務提供商就可以從橫向擴展網絡中獲益。網絡行業已經發現,具有第 2 層轉發和生成樹的傳統網絡架構效率低下,而且難以擴展。他們過渡到 IP 網絡結構。

這是一個很好的開始,但在某些情況下,它可能不足以解決新類型的應用程序和跨數據中心引入的流量。

可擴展 IP 網絡的一個關鍵屬性是它們能夠跨多個交換機層次結構分布大量流量和流量。

在一個完美的世界中,數據流是完全不相關的,因此在多個網絡鏈路上分布均勻、負載平衡平穩。該方法依賴于現代哈希和多路徑算法,包括等成本多路徑( ECMP )。運營商受益于任何規模的數據中心中的高端口數、固定外形的交換機。

然而,在許多情況下,這是行不通的,通常包括無處不在的現代工作負載,如 AI 、云和存儲。

pYYBAGL5_TWARGiLAACVWFp7a9A234.png

圖 1 :。介紹 NVIDIA 自適應路由

問題是有限熵的問題。熵是一種衡量流經給定網絡的流量的豐富性和多樣性的方法。

當您有數千個從全球各地的客戶端隨機連接的流時,您的網絡被稱為有 high entropy 。然而,當您只有少數大型流時(這在 AI 和存儲工作負載中經常發生),大型流會控制帶寬,因此會出現 low entropy 。這種低熵流量模式也稱為 elephant flow 分布,在許多數據中心工作負載中都很明顯。

那么為什么熵很重要呢?

使用靜態 ECMP 的傳統技術,您需要高熵來將流量均勻地分布在多個鏈路上,而不會出現擁塞。然而,在大象流場景中,多個流可以在同一條鏈路上對齊,從而創建一個超額預訂的熱點或微爆發。這會導致擁塞、延遲增加、數據包丟失和重傳。

對于許多應用程序,性能不僅取決于網絡的平均帶寬,還取決于流完成時間的分布。完成時間分布中的長尾或異常值可能會顯著降低應用程序性能。圖 2 顯示了低熵對流完成時間的影響。

pYYBAGL5_TyASv9ZAABqqYK5OY0942.png

圖 2 :。網絡擁塞示例

此示例由單個機架頂部交換機組成,具有 128 個 100G 端口。

64 個端口是連接到服務器的 100G 下游端口。

64 個端口是連接到第 1 層交換機的 100G 上游端口。

每個下游端口接收四個帶寬相等的流量: 25G 每個流量,總共 256 個流量。

所有流量都通過靜態哈希和 ECMP 處理。

在最好的情況下,此配置的可用帶寬不會超額使用,因此可能會出現以下結果。在最壞的情況下,與理想情況相比,流程可能需要長達 2.5 倍的時間才能完成(圖 3)。

poYBAGL5_USAXjEUAACiJ6DR9tA339.png

圖 3 :。流量完成時間可能會有很大變化

在這種情況下,一些端口擁塞,而其他端口未使用。最后一個流量(最壞流量)的預期持續時間是預期第一個流量持續時間的 250% 。此外, 10% 的流量預計流量完成時間超過 150% 。也就是說,有一個長尾流,完成時間比預期的要長。為了避免高置信度擁塞( 98% ),必須將所有流的帶寬降低到 50% 以下。

為什么有許多流會因完成時間過長而受到影響?這是因為 ECMP 上的一些端口非常擁擠。當流完成傳輸并釋放一些端口帶寬時,滯后流通過相同的擁塞端口,導致更多擁塞。這是因為在對標頭進行哈希處理后,路由是靜態的。

自適應路由

NVIDIA 正在為頻譜交換機引入自適應路由。通過自適應路由,轉發到 ECMP 組的流量選擇擁塞程度最低的端口進行傳輸。擁塞基于出口隊列負載進行評估,確保 ECMP 組在不考慮熵級別的情況下保持良好平衡。向多個服務器發出多個請求的應用程序以最小的時間變化接收數據。

這是如何實現的?對于轉發到 ECMP 組的每個數據包,交換機在其出口隊列上選擇負載最小的端口。評估的隊列是那些與數據包服務質量匹配的隊列。

相比之下,傳統的 ECMP 基于哈希方法進行端口決策,這通常無法產生清晰的比較。當相同流的不同數據包通過網絡的不同路徑傳輸時,它們可能會無序到達目的地。在 RoCE 傳輸層, NVIDIA ConnectX NIC 負責處理無序數據包,并將數據按順序轉發給應用程序。這使得從中受益的應用程序看不到自適應路由的魔力。

在發送方方面, ConnectX 可以動態標記流量,以符合網絡重新排序的條件,從而確保在需要時可以強制執行消息間排序。交換機自適應路由分類器只能對這些標記的 RoCE 流量進行分類,使其服從其唯一的轉發。

頻譜自適應路由技術支持各種網絡拓撲。對于 CLO (或葉/脊椎)等典型拓撲,到給定目標的各種路徑的距離是相同的。因此,交換機通過擁塞最小的端口傳輸數據包。在路徑之間距離不同的其他拓撲中,交換機傾向于通過最短路徑發送流量。如果擁塞發生在最短路徑上,則選擇擁塞最小的備選路徑。這確保了網絡帶寬得到有效利用。

工作量結果

存儲

為了驗證 RoCE 中自適應路由的效果,我們從測試簡單的 RDMA 寫測試應用程序開始。在這些在多個 50 Gb / s 主機上運行的測試中,我們將主機分成幾對,每對主機在很長一段時間內互相發送大型 RDMA 寫流。這種類型的流量模式是存儲應用程序工作負載中的典型模式。

圖 4 顯示了基于哈希的靜態路由在上行鏈路端口上發生沖突,導致流完成時間增加,帶寬減少,流之間的公平性降低。在轉移到自適應路由后,所有問題都得到了解決。

poYBAGL5_UqAR-2dAACod1EFBFQ723.png

圖 4 :。針對存儲工作負載的自適應路由

在第一個圖中,所有流幾乎同時完成,峰值帶寬相當。

在第二個圖中,一些流實現了相同的帶寬和完成時間,而其他流發生沖突,導致完成時間更長,帶寬更低。實際上,在 ECMP 的情況下,一些流在 13 秒的理想完成時間 T 內完成,而性能最差的流需要 31 秒,約為 T 的 2.5 倍。

人工智能/高性能混凝土

為了繼續評估 RoCE 工作負載中的自適應路由,我們在一個 32 服務器測試臺上測試了常見 AI 基準的性能增益,該測試臺在兩級 fat 樹網絡拓撲中使用四個 NVIDIA 頻譜交換機構建。該基準評估了分布式 AI 培訓和 HPC 工作負載中常見的集體操作和網絡流量模式,如全對全流量和全減少集體操作。

總結

在許多情況下,基于靜態哈希的轉發會導致高擁塞和可變流完成時間。這會降低應用程序級性能。

NVIDIA 頻譜自適應路由解決了這個問題。這項技術增加了網絡使用的帶寬,最大限度地減少了流完成時間的變化,從而提高了應用程序的性能。

將此技術與 NVIDIA ConnectX NIC 提供的 RoCE 無序支持相結合,應用程序對所使用的技術是透明的。這確保了 NVIDIA Spectrum Ethernet 平臺提供了實現最大數據中心性能所需的加速以太網。

關于作者

Gil Levy 擁有 25 年的網絡產品 ASIC 設計經驗。他的重點領域是高速數據包處理、數據包緩沖、擁塞控制、可編程性和遙測。在過去的 8 年中,他一直在 NVIDIA 的頻譜以太網產品線工作。他之前曾為 Marvell 、 Broadlight 和 Galileo 工作,為企業、 metro 和數據中心市場開發以太網交換機和網絡處理器 ASIC 。吉爾擁有特拉維夫大學電氣工程學士學位,目前正在瑞奇曼大學攻讀計算機科學碩士學位。

Yonatan Piasetzky 在 NVIDIA 網絡業務部門( NBU )的端到端高級開發團隊工作。 Yonatan 從端到端的角度研究 HPC 和 AI 工作負載的加速網絡,包括 DPU 和交換機,以及下一代高性能網絡的虛擬化和云解決方案。 Yonatan 在特拉維夫大學獲得物理和電氣工程學士學位,在魏茨曼研究所獲得理學碩士學位,目前正在特拉維夫大學攻讀集成光子學量子計算博士學位。

Barak Gafni 是 NVIDIA 的架構師,專注于實現未來的高性能、可擴展和簡單網絡。巴拉克擁有特拉維夫大學電氣工程學士學位,曾參與撰寫多份 IETF 草案,并在網絡領域擁有多項專利。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    40

    文章

    5586

    瀏覽量

    174860
  • NVIDIA
    +關注

    關注

    14

    文章

    5246

    瀏覽量

    105787
  • 服務器
    +關注

    關注

    13

    文章

    9700

    瀏覽量

    87315
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    矩陣變換器驅動異步電機模糊自適應PI控制

    純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:矩陣變換器驅動異步電機模糊自適應PI控制.pdf【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!
    發表于 06-04 14:46

    NVIDIA硅光網絡交換機在數據中心中的優勢

    NVIDIA 通過將硅光技術直接與 NVIDIA Quantum 和 NVIDIA Spectrum 交換機 IC 集成,開辟了新的領域。在
    的頭像 發表于 04-11 09:54 ?324次閱讀

    永磁同步電機自適應高階滑模Type-2模糊控制

    。文章來源于網絡,純分享帖,點擊附件查看全文(如有涉及侵權,請聯系刪除!)*附件:永磁同步電機自適應高階滑模Type-2模糊控制.pdf
    發表于 03-27 11:54

    NVIDIA加速的Apache Spark助力企業節省大量成本

    隨著 NVIDIA 推出 Aether 項目,通過采用 NVIDIA 加速的 Apache Spark 企業得以自動加速其數據中心規模的分析
    的頭像 發表于 03-25 15:09 ?447次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>的Apache Spark助力企業節省大量成本

    NVIDIA推出全新硅光網絡交換機

    NVIDIA 今天推出了 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光網絡交換機,使 AI 工廠能夠跨區域
    的頭像 發表于 03-20 14:52 ?404次閱讀

    GLAD應用:大氣像差與自適應光學

    概述 激光在大氣湍流中傳輸時會拾取大氣湍流導致的相位畸變,特別是在長距離傳輸的激光通信系統中。這種畸變會使傳輸激光的波前劣化。通過在系統中引入自適應光學系統,可以對激光傳輸時拾取的低頻畸變進行校正
    發表于 03-10 08:55

    基于自適應優化的高速交叉矩陣設計

    提出了一種基于自適應優化的交叉矩陣傳輸設計,采用AHB協議并引入自適應突發傳輸調整和自適應優先級調整的創新機制。通過動態調整突發傳輸的長度和優先級分配,實現了對數據流的有效管理,提升了
    的頭像 發表于 01-18 10:24 ?351次閱讀

    NVIDIA加速計算如何推動醫療健康

    近日,NVIDIA 企業平臺副總裁 Bob Pette 在 AI Summit 一場演講中重點談論了 NVIDIA 加速計算如何推動醫療健康、網絡安全和制造等行業實現轉型。他表示,
    的頭像 發表于 11-20 09:10 ?602次閱讀

    NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

    市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡平臺,該平臺
    發表于 10-30 09:33 ?296次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網<b class='flag-5'>加速</b> xAI 構建的全球最大 AI 超級計算機

    步進電機如何自適應控制?步進電機如何細分驅動控制?

    步進電機是一種將電脈沖信號轉換為角位移或線位移的電機,廣泛應用于各種自動化控制系統中。為了提高步進電機的性能,自適應控制和細分驅動控制是兩種重要的技術手段。 一、步進電機的自適應控制 自適應控制
    的頭像 發表于 10-23 10:04 ?1470次閱讀

    簡單認識NVIDIA網絡平臺

    NVIDIA Spectrum-X800 平臺是業界第一代 800Gb/s 的以太網網絡平臺,包括了 NVIDIA Spectrum SN5
    的頭像 發表于 09-09 09:22 ?735次閱讀

    TUSB1146的自適應均衡帶來的益處

    電子發燒友網站提供《TUSB1146的自適應均衡帶來的益處.pdf》資料免費下載
    發表于 09-03 10:56 ?0次下載
    TUSB1146的<b class='flag-5'>自適應</b>均衡帶來的益處

    ALINX受邀參加AMD自適應計算峰會

    近日,AMD 自適應計算峰會(AMD Adaptive Computing Summit, 即 AMD ACS)在深圳舉行,聚焦 AMD 自適應 SoC 和 FPGA 產品最新動態,以及設計工具和開發環境的前沿技巧,是全球硬件開發者和工程師們深入交流與學習的優質平臺。
    的頭像 發表于 08-02 14:36 ?887次閱讀

    應用NVIDIA Spectrum-X網絡構建新型主權AI云

    法國云服務提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPU和 Spectrum-X 以太網網絡平臺 構建區域性 GPU 集群,為用戶提供 AI 按需服務業
    的頭像 發表于 07-26 18:58 ?1412次閱讀

    如何在自己的固件中增加wifi自適應性相關功能,以通過wifi自適應認證測試?

    目前官方提供了自適應測試固件 ESP_Adaptivity_v2.0_26M_20160322.bin 用于進行 wifi 自適應認證測試. 請問如何在自己的固件中增加 wifi 自適應性相關功能,以
    發表于 07-12 08:29
    主站蜘蛛池模板: 国产www色| 2014天堂| 国产老肥熟xxxx | 在线看逼 | 亚洲情a成黄在线观看动 | 男人日女人免费视频 | a级精品九九九大片免费看 a级毛毛片看久久 | 一级女人毛片人一女人 | 五月婷婷六月丁香在线 | 免费国产成人午夜私人影视 | 亚洲免费一级视频 | 黄网站在线观看永久免费 | 久久成人综合网 | 夜夜夜精品视频免费 | 97菊爱网| 日本卡一卡2卡3卡4精品卡无人区 | 超黄视频在线观看 | 香蕉久久精品 | 在线亚洲成人 | 国产美女精品久久久久久久免费 | 一区二区三区四区视频在线观看 | 图片区网友自拍另类图区 | 中文字幕一区二区视频 | 精品国产麻豆免费人成网站 | 色视频网站在线观看 | 视频网站黄色 | 四虎网站| 天天综合天天看夜夜添狠狠玩 | 国产高清一区二区三区四区 | 在线免费观看毛片网站 | 毛片多多 | 一级做a爱 | 狠狠操狠狠摸 | 午夜在线播放视频在线观看视频 | 中国日韩欧美中文日韩欧美色 | 天天爽天天狼久久久综合 | 中文字幕在线播放第一页 | www久久久| 欧美激情二区三区 | 国产999星空传媒在线观看 | 在线另类 |