你需要知道的...
以GPT-4和Llama3為代表的大語言模型實現了突破性進展,引爆了高性能計算。由于大語言模型爆炸增長的存儲和算力需求,其分布式計算需要芯片間進行高頻通信,網絡流量急劇增加。所以對通信網絡提出超大規模組網、超高帶寬、超低時延、超高穩定性和網絡自動化部署新需求,典型網絡架構轉向多核心、少收斂形態。
以下這些關鍵詞帶你更快了解高性能網絡的通信及互聯需求。
RDMA技術解析
RDMA(RemoteDirect Memory Access)技術全稱遠程直接內存訪問,就是為了解決網絡傳輸中服務器端數據處理的延遲而產生的。RDMA技術能直接通過網絡接口訪問內存數據,無需操作系統內核的介入。這允許高吞吐、低延遲的網絡通信,尤其適合在大規模并行計算機集群中使用。
RDMA的三大分類
目前支持RDMA的網絡協議主要有三種,Infiniband, RoCE和iWARP。Infiniband是一種專為RDMA設計的網絡,從硬件級別保證可靠傳輸,技術先進,但是成本高昂。
iWARP和RoCE都是基于以太網的RDMA技術,但是iWARP是基于TCP/IP協議,相比于基于硬件的RoCE解決方案有更高的性能損失,在高性能網絡的環境表現中不如RoCE。
高速、超低延時、極低CPU使用率的基于RoCE的RDMA技術部署在目前使用最廣泛的以太網上。RoCE協議有RoCEv1和RoCEv2兩個版本,RoCEv1基于以太網鏈路層,使用以太網幀進行數據傳輸。RoCEv1沒有IP層,因此在傳輸數據時不使用IP地址,而RoCEv2基于IP層,使用UDP/IP進行數據傳輸。
RoCEv2將RDMA流量封裝在UDP包中,并使用標準的IP地址進行路由。這使得RoCEv2可以在路由器和交換機之間穿越,使其更適用于大規模的數據中心環境。
關于異構計算
高性能計算類應用的發展,驅動算力需求不斷攀升,但目前單一計算類型和架構的處理器已經無法處理日趨復雜、多樣化的計算任務。數據中心如何在增強算力和性能的同時,具備應對多種類型任務的處理能力,成為全球性的技術難題。在計算領域芯片企業的不斷探索和研究中,異構計算成為公認的算力突破“抓手”。
DSA 領域特定加速
隨著人工智能及高性能計算的高速發展,模型的訓練需要大量的存儲資源和計算資源,這些硬件資源的利用率需要通過有效的任務分配和數據處理來優化。在分布式人工智能及高性能計算系統中,多個計算節點之間需要頻繁通信,要求網絡具有低延遲和高帶寬,以避免通信瓶頸。針對網絡加速的DSA專用單元對任務卸載、加速,減少節點之間的數據延遲,提升數據傳輸效率,使CPU,GPU,NPU專注于核心計算任務,加速各項計算、存儲任務。
-
計算機
+關注
關注
19文章
7536瀏覽量
88639 -
網絡
+關注
關注
14文章
7599瀏覽量
89249 -
人工智能
+關注
關注
1796文章
47666瀏覽量
240286 -
RDMA
+關注
關注
0文章
78瀏覽量
8981
原文標題:KiwiLab 集合篇 | 關于智算中心高性能網絡,你需要知道這些...
文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論