6 月 20日,思科宣布推出專為人工智能超級計算機設計的新型網絡芯片,在推出 Cisco Silicon One 三年半之后,思科宣布推出第四代設備,即 Cisco Silicon One G200 和 Cisco Silicon One G202,將與博通和 Marvell Technology 的產品展開直接競爭。
目前幾家主要的云供應商已經在測試這些芯片,不過思科沒有透露相關公司的名稱。根據 Bofa Global Research的數據,主要的云計算參與者包括AWS、微軟 Azure 和谷歌云等。
隨著ChatGPT等 AI 應用的日益普及,單顆芯片的通信速度變得極其重要。
一次推出兩大芯片
最新一代思科以太網交換機 G200 和 G202 的性能是其前代產品的兩倍。這些芯片可以將多達 32,000 個圖形處理單元 (GPU) 連接在一起,使其非常適合 AI 和機器學習工作負載。
|51.2 Tbps 交換機的優勢
思科研究員 Rakesh Chopra 強調,G200 和 G202 芯片將成為市場上最強大的網絡芯片,為 AI/ML 任務提供更高的效率。
Cisco Silicon One G200
Cisco Silicon One G200 是一款 5 納米、51.2 Tbps、512 x 112 Gbps 的SerDes設備,具有可編程、確定性、低延遲等特性,且具備高級可見性和控制能力。Cisco Silicon One G200 提供了統一架構的優勢,專注于基于以太網的增強型AI/ML和網絡規模主干部署。
|Cisco Silicon One G200的構成
Cisco Silicon One G200 特性如下:
G200 展示了業界首款完全定制的 P4 可編程并行數據包處理器,每秒能夠啟動超過 4350 億次查找。它以全速提供 SRv6 Micro-SID (uSID) 等高級功能,并支持復雜流程的完整運行到完成處理。這種獨特的數據包處理架構確保了靈活性以及確定性的低延遲和功耗。
與替代解決方案相比,G200 憑借更高的基數脫穎而出,擁有 512 個以太網 MAC。通過消除不必要的層,顯著降低客戶網絡部署的成本、功耗和延遲。
G200 能夠驅動 43 dB 碰撞通道,支持共封裝光學器件 (CPO)、線性可插拔對象 (LPO) 以及 4 米 26 AWG 銅纜的使用,超過了最佳機架內連接的 IEEE 標準。
此外,G200具有先進的擁塞感知負載均衡技術,使網絡能夠避免傳統的擁塞事件。還有先進的packet-spraying 技術,最大限度地減少了網絡擁塞熱點的產生。
|Cisco Silicon One G200框圖
Cisco Silicon One G202
Cisco Silicon One G202 處理器是一款 25.6-Tbps、全雙工、獨立的交換處理器,可用于構建固定外形規格的交換機,適合利用 50G SerDes 與交換機進行光纖連接的客戶,非常適合網絡級數據中心脊葉應用和 AI/ML 應用。
|Cisco Silicon One G202框圖
Cisco Silicon One G200 和 G202 可優化 AI/ML 工作負載的實際性能,同時通過重大創新降低網絡成本、功耗和延遲。
為了實現 Cisco Silicon One 的愿景,思科七年前開始投資關鍵技術——高速 SerDes 開發。思科意識到隨著速度的提高,行業必須轉向基于ADC(模數轉換器)的 SerDes。
SerDes 作為高性能計算和 AI 部署的基本網絡互連組件,發揮著至關重要的作用。如今,思科的下一代超高性能和低功耗 112 Gbps ADC SerDes 能夠支持 4 米直連電纜 (DAC)、傳統光學器件、LDO)和CPO,同時最大限度地減少硅晶片面積和功率。
思科押寶網絡芯片,擴充網絡版圖
過去多年里,Facebook 和微軟等巨頭一直在設計自己的網絡硬件,并將生產外包給海外制造商。思科之所以會滋生這個想法,是因為大型科技公司希望可以創建滿足其特定需求的定制網絡設備,而不是購買思科的傳統路由器和交換機。
思科CEO Chuck Robbins在2019年接受媒體外媒的時候曾表示:“向服務提供商(包括電信公司)銷售產品,幾年來一直是一個艱難的市場。”公司的業績和股市也在這段時間遭受沖擊。這就驅使網絡巨頭去尋找新的路數。因此,思科希望通過銷售專用網絡芯片,吸引那些自己制造硬件但仍需要專用芯片的科技巨頭。
思科從1999年收購半導體公司StratumOne Communications,之后通過多次收購半導體相關公司,積累了豐富的人才和技術資源。2019年,思科掀開了公司自研芯片的轟轟烈烈新序幕,并于當年12月首次推出了Silicon One芯片架構,當時稱其目標是為“未來網絡奠定通用基礎”。
對外銷售公司思科推出的Silicon One芯片就成為了思科的新“救命稻草”。思科也希望通過這種方式帶來改變,吸引客戶購買思科的新芯片或由他們提供動力的公司新路由器和交換機。思科CEO Chuck Robbin更是自豪地說:“從今天開始,我們將做一些你們中的一些人從未想過我們會做的事情——向我們的一些客戶出售我們的芯片并幫助他們構建其產品。”思科在當時也透露,他們正在向包括 Facebook、微軟和AT&T在內的少數知名企業銷售網絡芯片。
近日,思科又帶來了用于人工智能超級計算機的網絡芯片。思科表示,這些芯片可以幫助執行人工智能和機器學習任務,減少 40% 的交換機和更少的延遲,同時提高能效。
思科正面硬剛,博通、Marvell如何應對?
盡管思科來勢洶洶,但早在市場占據領先優勢的博通和 Marvell可不是吃素的。
今年3月,Marvell推出了用于 800 Gb/秒交換機的 51.2 Tb/秒 Teralynx 10交換機ASIC。
早在2021年,Marvell就收購了云數據中心商業交換機芯片供應商Innovium。Innovium于 2019 年 9 月推出了 Teralynx 5 芯片,速度范圍從 1 Tb/秒到 6.4 Tb/秒,隨后推出的Teralynx 7 直接與博通的“Tomahawk 4”StrataXGS對標, 2020 年 5 月,Innovium推出了 Teralynx 8 交換芯片,針對超大規模器和云構建器的葉、脊和數據中心互連 (DCI) 用例,使用 100 Gb/秒 PAM-4 編碼跨 8 Tb/秒到 25.6 Tb/秒在給定帶寬下創建以太網端口。
據Marvell介紹,Teralynx 10 是更大、更胖(fat)的交換機 ASIC,它也基于采用 PAM-4 編碼的 100 Gb/秒 SerDes,是一款專為 800GbE 時代設計的 51.2T 可編程 5nm交換機芯片,旨在解決運營商帶寬爆炸的問題,同時滿足嚴格的功耗和成本要求。它可適用于下一代數據中心網絡中的 leaf 和 spine 應用,以及 AI / ML 和高性能計算 (HPC) 結構。
據介紹,一個 Teralynx 10 相當于 12 個 12.8 Tbps 一代芯片,由此可以在同等容量下減少 80% 的功耗。Teralynx 10 具有 512 個長距離 (LR) 112G SerDes,有了它,交換機系統可以開發出更全面的交換機配置,例如 32 x 1.6T、 64 x 800G 和 128 x 400G 鏈路。
4 月,博通也發布了新的 Jericho3-AI 芯片,可以將多達 32,000 個 GPU 芯片連接在一起。
在交換機芯片部分,博通有三個系列的交換芯片,Tomahawk系統芯片是高帶寬交換機平臺芯片;Trident系列芯片是多功能的平臺芯片;Jericho系列芯片則主打較低帶寬,但有多緩沖和可編程性平臺芯片;博通Jericho3-AI是Jericho系列中的最新成員。
Jericho3-AI結構的主要特點是負載平衡,以保持鏈路不擁擠,結構調度,零影響故障切換,以及具有高以太網徑向。
據介紹,Jericho3-AI 的最高吞吐量為 28.8Tb/s。它有 144 個以 106Gbps PAM4 運行的 SerDes 通道,支持多達 18 個 800GbE/36 個 400GbE/72 個 200GbE 網絡端口。Jericho3-AI 還具有比上一代改進的負載平衡功能,以確保最大的網絡利用率和無擁塞操作。
網絡芯片在人工智能應用中的意義
ChatGPT 等人工智能應用嚴重依賴 GPU 等專用芯片。這些芯片之間的高效通信對于確保最佳性能至關重要。思科網絡芯片的推出旨在滿足這一需求并為 AI 超級計算機提供增強的連接性。
650 Group在最近的一篇博客中指出,思科在不斷增長的人工智能網絡市場占據了一席之地,該市場的其他玩家還包括博通、Marvell和Arista 等。預計到 2027 年人工智能網絡市場的規模將達到 100億美元。
過去兩年,人工智能網絡蓬勃發展。未來AI/ML 將成為網絡領域的巨大機遇,并且將成為數據中心網絡增長的主要驅動力之一。650 Group表示:“未來 10 年,許多垂直行業將因人工智能而經歷多次變化。”
審核編輯:劉清
-
人工智能
+關注
關注
1804文章
48737瀏覽量
246664 -
機器學習
+關注
關注
66文章
8492瀏覽量
134122 -
AI芯片
+關注
關注
17文章
1969瀏覽量
35696
原文標題:思科推出新的AI網絡芯片,正面硬剛博通、Marvell
文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論