在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在ZTR無配置大規模中實現的縮放零接觸RoCE技術

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-14 14:15 ? 次閱讀

NVIDIA Zero Touch RoCE ( ZTR )使數據中心能夠無縫部署 聚合以太網上的 RDMA ( RoCE ) ,而無需任何特殊交換機配置。直到最近, ZTR 還僅適用于中小型數據中心。同時,大規模部署傳統上依賴于顯式擁塞通知( ECN )來啟用 RoCE 網絡傳輸,這需要交換機配置。

新的 NVIDIA 擁塞控制算法往返時間擁塞控制( RTTCC ) – 允許 ZTR 在不影響性能的情況下擴展到數千臺服務器。通過使用 ZTR 和 RTTCC ,數據中心運營商可以在無需任何交換機配置的情況下,享受部署和操作的便利性,以及大規模遠程直接內存訪問( RDMA )的卓越性能。

這篇文章描述了以前在大規模和小型 RoCE 部署中推薦的 RoCE 擁塞控制。然后介紹了一種新的擁塞控制算法,該算法允許 ZTR 的無配置大規模實現,其性能類似于支持 ECN 的 RoCE 。

具有數據中心量化擁塞通知的 RoCE 部署

在典型的基于 TCP 的環境中,分布式內存請求需要許多步驟和 CPU 周期,這會對應用程序性能產生負面影響。 RDMA 消除了服務器之間內存數據傳輸的所有 CPU 參與,大大加快了對存儲數據的訪問和應用程序性能。

RoCE 在以太網環境中提供 RDMA ,這是數據中心的主要網絡結構。以太網需要高級擁塞控制機制來支持 RDMA 網絡傳輸。數據中心量化擁塞通知( DCQCN )是一種擁塞控制算法,能夠響應擁塞通知并動態調整流量傳輸速率。

DCQCN 的實現需要啟用顯式擁塞通知( ECN ),這需要配置網絡交換機。 ECN 將交換機配置為設置擁塞經歷( CE )位,以指示即將發生的擁塞。

具有無功擁塞控制的零接觸 RoCE

NVIDIA 開發的 ZTR 技術允許 RoCE 部署,無需配置交換機基礎設施。 ZTR 根據 InfiniBand Trade Association ( IBTA ) RDMA 標準構建,完全符合 RoCE specifications ,支持 RoCE 的無縫部署。 ZTR 還擁有與傳統交換機啟用的 RoCE 相當的性能,并且明顯優于傳統的基于 TCP 的內存訪問。此外,通過 ZTR , RoCE 網絡傳輸服務在普通 TCP / IP 環境中與非 RoCE 通信并行運行。

正如 NVIDIA 零接觸 RoCE 技術為 Microsoft Azure Stack HCI 實現了云經濟 文章中所指出的,微軟已經為其 Azure Stack HCI 平臺驗證了 ZTR ,該平臺通常可擴展到幾十個節點。在這樣的環境中, ZTR 依賴于隱式丟包通知,這對于小規模部署來說已經足夠了。通過添加新的基于往返計時器( RTT )的擁塞控制算法, ZTR 變得更加健壯和可擴展,而無需依賴丟包來通知服務器網絡擁塞。

引入往返時間擁塞控制

新的 NVIDIA 擁塞控制算法 RTTCC 主動監控網絡 RTT ,以便在丟棄數據包之前主動檢測并適應擁塞的發生。 RTTCC 使用基于硬件的反饋環路實現動態擁塞控制,與基于軟件的擁塞控制算法相比,該反饋環路提供了顯著優越的性能。 RTTCC 還支持更快的傳輸速率,可以在更大范圍內部署 ZTR 。帶有 RTTCC 的 ZTR 現在作為測試版功能提供, GA 計劃在 2022 年下半年推出。

ZTR-RTTCC 的工作原理

ZTR-RTTCC 通過基于硬件 RTT 的擁塞控制算法擴展了 RoCE 網絡中的 DCQCN 。

圖 1 服務器之間的往返計時

定時數據包(上圖中的綠色網絡數據包)定期從啟動器發送到目標。立即返回定時數據包,從而能夠測量往返延遲。 RTTCC 測量數據包發送和啟動器接收數據包之間的時間間隔。差異(接收時間–發送時間)衡量往返延遲,這表明路徑擁塞。未壓縮流繼續傳輸數據包,以最佳利用可用網絡路徑帶寬。延遲增加的流意味著路徑擁塞, RTTCC 會對流量進行節流,以避免緩沖區溢出和數據包丟失。

隨著擁塞的減少或增加,網絡流量可以實時地向上或向下調整。主動監控和應對擁塞的能力對于使 ZTR 能夠主動管理擁塞至關重要。這種主動速率控制還可以減少數據包的重新傳輸,提高 RoCE 性能。使用 ZTR-RTTCC ,數據中心節點不會等待數據包丟失的通知;相反,它們主動識別擁塞 prior to 數據包丟失并作出相應反應,通知啟動器調整傳輸速率。

如前所述, ZTR 的一個關鍵優勢是能夠提供 RoCE 功能,同時在普通 TCP / IP 流量中與非 RoCE 通信同時運行。 ZTR 提供 RoCE 網絡功能的無縫部署。通過添加 RTTCC 主動監控擁塞, ZTR 提供數據中心范圍內的操作,無需交換機配置。請繼續閱讀,看看它的性能如何。

具有 RTTCC 性能的 ZTR

如圖 2 所示,當通過網絡結構配置 ECN 和 PFC 時,帶有 RTTCC 的 ZTR 提供了與 RoCE 相當的應用程序性能。這些測試是在最壞的多對一( in-cast )情況下進行的,以模擬擁擠條件下的吞吐量。

結果表明,具有 RTTCC 的 ZTR 不僅可以擴展到數千個節點,而且其性能與目前可用的最快 RoCE 解決方案相當。

在小規模( 256 個連接及以下)下,具有 RTTCC 的 ZTR 在啟用 ECN 擁塞控制(傳統 RoCE )的 RoCE 的 99% 范圍內執行。

通過 16000 多個連接,具有 RTTCC 吞吐量的 ZTR 是傳統 RoCE 吞吐量的 98% 。

帶有 RTTCC 的 ZTR 在不需要任何開關配置的情況下,提供了與傳統 RoCE 幾乎相同的性能。

圖 2 連接不斷增加的應用程序帶寬

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網絡接口卡安裝最新固件和工具,請執行以下步驟。

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網絡接口卡安裝最新固件和工具,請執行以下步驟。

使用mlxconfig(持續配置)啟用可編程擁塞控制:

mlxconfig -d /dev/mst/mt4125_pciconf0 -y s
ROCE_CC_LEGACY_DCQCN=0

使用mlxfwreset重置設備或重新啟動主機:

mlxfwreset -d /dev/mst/mt4125_pciconf0 -l 3 -y r

完成這些步驟后,當 RDMA-CM 用于增強連接建立( ECE , MLNX _ OFED 版本 5.1 支持)時,將使用 ZTR-RTTCC 。

如果出現錯誤,無論 RDMA-CM 同步狀態如何,都可以強制使用 ZTR-RTTCC :

mlxreg -d /dev/mst/mt4125_pciconf0 --reg_id 0x506e --reg_len
0x40 --set "0x0.0:8=2,0x4.0:4=15" -y

總結

NVIDIA RTTCC 是 ZTR 的新擁塞控制算法,在數據中心范圍內提供卓越的 RoCE 性能,無需對交換機基礎設施進行任何特殊配置。此增強功能使數據中心能夠在現有和新的數據中心基礎架構中無縫實現 RoCE ,并從即時的應用程序性能改進中獲益。

關于作者

Aviv Barnea 是 NVIDIA 網絡軟件工程的高級主管。他監督網絡適配器 RDMA 軟件和擁塞控制機制的開發,實現高速、低延遲的數據中心連接。 Aviv 是 RDMA 和 RoCE 通信協議方面的專家,擁有該領域的多項專利,在推動 RDMA / RoCE 在業界的發展方面發揮了重要作用,在客戶和合作伙伴大規模部署加速網絡解決方案時與他們密切合作,并實現了無與倫比的性能和易用性。 Aviv 擁有特拉維夫大學工商管理碩士學位和理工學院物理與電氣工程學士學位。

Itay Ozery 是 NVIDIA 網絡產品營銷總監。他為 Mellanox 的云網絡解決方案推動戰略性產品營銷和產品管理計劃。 Itay 在網絡安全領域領導了大規模的業務和項目,并與數據中心和電信服務提供商在 IT 系統和網絡工程領域擔任過多個職位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 接口
    +關注

    關注

    33

    文章

    8694

    瀏覽量

    151929
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103729
收藏 人收藏

    評論

    相關推薦

    小米澄清年底大規模裁員傳聞

    近日,網絡上流傳著一條關于小米公司將在年底進行大規模裁員的傳聞,引起了廣泛關注。針對這一傳聞,小米集團公關部總經理王化個人社交平臺上進行了正式回應,以澄清事實。 王化指出,有關小米年底將進行大規模
    的頭像 發表于 12-26 10:46 ?234次閱讀

    RoCE與IB對比分析(二):功能應用篇

    在上一篇,我們對RoCE、IB的協議棧層級進行了詳細的對比分析,二者本質沒有不同,但基于實際應用的考量,RoCE開放性、成本方面更勝一籌。本文我們將繼續分析
    的頭像 發表于 11-15 14:03 ?420次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(二):功能應用篇

    RoCE與IB對比分析(一):協議棧層級篇

    AI 算力建設, RDMA 技術是支持高吞吐、低延遲網絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現:Infiniband和
    的頭像 發表于 11-15 13:58 ?1333次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協議棧層級篇

    VPS600超大規模透鏡顯微成像芯片獲“中國芯”芯火新銳產品獎

    2024國微電子產業促進大會暨第十九屆“中國芯”優秀產品征集結果發布儀式于11月6-8日橫琴粵澳深度合作區舉行。南京威派視半導體技術有限公司VPS600超大規模
    的頭像 發表于 11-08 13:26 ?403次閱讀
    VPS600超<b class='flag-5'>大規模</b><b class='flag-5'>無</b>透鏡顯微成像芯片獲“中國芯”芯火新銳產品獎

    FPGA仿真黑科技\"EasyGo Vs Addon \",助力大規模電力電子系統仿真

    可以輕松地將其與各種硬件和協議連接,增強測試系統的靈活性。二、產品亮點▍超強FPGA芯片與接口配置,助力大規模電力電子系統仿真EasyGo Vs Addon支持的PXIe 7891搭載全新
    發表于 10-23 18:18

    云平臺大規模設備管理和數據分析的作用

    在當代數字化轉型的浪潮,云平臺作為信息技術基礎設施的核心組件,扮演著無可替代的角色,尤其大規模設備管理和數據分析領域,其重要性和影響力日益凸顯。本文旨在深入探討云平臺如何通過其獨特
    的頭像 發表于 09-19 17:22 ?351次閱讀
    云平臺<b class='flag-5'>在</b><b class='flag-5'>大規模</b>設備管理和數據分析<b class='flag-5'>中</b>的作用

    使用DSPLIB FFT實現實現實際輸入,無需數據縮放

    電子發燒友網站提供《使用DSPLIB FFT實現實現實際輸入,無需數據縮放.pdf》資料免費下載
    發表于 09-19 11:27 ?0次下載
    使用DSPLIB FFT<b class='flag-5'>實現實現</b>實際輸入,無需數據<b class='flag-5'>縮放</b>

    大規模語言模型:從理論到實踐】- 每日進步一點點

    非常推薦大家去讀 【大規模語言模型:從理論到實踐】這本書,系統的講解了大模型的前世今生,對各個環節知識進行了普及。 今天跟我一起學習歸一化的部分。 大模型訓練的歸一化是一個關鍵步驟,旨在提高模型
    發表于 05-31 19:54

    奧比光攜最新3D視覺感知相機亮相日本最大規模AI展

    5月22日-24日,日本最大規模人工智能展——AI EXPO Japan東京有明國際展覽中心盛大開幕,匯聚全球尖端的AI技術和創新應用。
    的頭像 發表于 05-28 09:32 ?379次閱讀

    摩爾線程與問芯穹國產GPU上首次實現大模型實訓

    近日,摩爾線程與問芯穹共同宣布,雙方已正式完成基于國產全功能GPU千卡集群的3B規模大模型實訓。這款名為“MT-infini-3B”的模型,摩爾線程夸娥(KUAE)千卡智算集群與
    的頭像 發表于 05-27 10:59 ?706次閱讀

    Arm計劃2025年大規模銷售AI芯片

    軟銀集團旗下的英國芯片巨頭Arm近日公布了其雄心勃勃的AI芯片銷售計劃。該公司宣布,計劃到2025年實現AI芯片的大規模銷售,以進一步鞏固其全球芯片市場的領先地位。
    的頭像 發表于 05-20 10:48 ?683次閱讀

    深度解讀RoCE v2的核心技術原理

    RoCE v2是一種專為實現以太網環境下低延遲、高吞吐量數據傳輸而設計的RDMA協議。相較于涉及多重處理層次的傳統數據傳輸方式,RoCE v2實現了系統間的直接內存訪問機制,最大限度地
    發表于 04-29 10:32 ?5078次閱讀
    深度解讀<b class='flag-5'>RoCE</b> v2的核心<b class='flag-5'>技術</b>原理

    專用集成電路都是大規模的嗎為什么呢

    的集成度和性能優勢。然而,并非所有專用集成電路都是大規模的,因為集成度的大小取決于設計和制造的要求。 探討專用集成電路是否大規模之前,我們首先需要了解什么是大規模集成電路(Very
    的頭像 發表于 04-21 09:15 ?590次閱讀

    專用集成電路都是大規模的嗎為什么

    Integrated Circuit, GPIC)相比,ASIC針對特定的應用程序進行了優化和定制,以實現更高的性能、更低的功耗和更小的面積。 專用集成電路之所以通常是大規模的,是因為它們需要集成
    的頭像 發表于 04-14 10:48 ?643次閱讀

    名單公布!【書籍評測活動NO.30】大規模語言模型:從理論到實踐

    大模型實踐和理論研究的過程,歷時8個月完成 《大規模語言模型:從理論到實踐》 一書的撰寫。希望這本書能夠幫助讀者快速入門大模型的研究和應用,并解決相關技術問題。 本書一經上市,
    發表于 03-11 15:16
    主站蜘蛛池模板: 性欧美video视频另类 | 国产在线观看www鲁啊鲁免费 | 高清不卡一区二区三区 | 亚洲色网址 | 六月丁香婷婷激情国产 | 六月激情 | 人人看人人做人人爱精品 | 国产黄色在线看 | 天天澡天天摸天天添视频 | 在线播放免费 | 久久久国产乱子伦精品 | 干美女在线视频 | 天天曰天天干天天操 | 国产三级精品三级在线观看 | 日本天天操 | 综合亚洲一区二区三区 | 亚洲精品久久久久久婷婷 | 全午夜免费一级毛片 | 天天射天天射天天射 | 色噜噜狠狠成人网 | 三级黄页 | 乱好看的的激情伦小说 | 亚洲hhh | 97人人揉人人捏人人添 | 日本一区三区二区三区四区 | 亚洲精品黄色 | 岛国毛片一级一级特级毛片 | 人人爽人人看 | 天天操天天擦 | 永久免费看片 | 欧美在线不卡视频 | 日韩一级在线播放免费观看 | 热99久久| 韩国朴银狐诱感在线观看 | 最新黄色大片 | 人人干干 | 精品视频一区二区三区 | 男人资源站 | 性夜影院爽黄e爽在线观看 羞羞色院91精品网站 | 国产二区三区 | 日本一区不卡在线观看 |