電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日Linux基金會(huì)再度牽手主要云服務(wù)廠商、半導(dǎo)體廠商以及系統(tǒng)方案供應(yīng)商,成立了超以太網(wǎng)聯(lián)盟(UEC)。聯(lián)盟成員包括AMD、微軟、博通、思科、HPE以及Meta等廠商,幾乎可以說是HPC與AI領(lǐng)域的半壁江山了,而該聯(lián)盟的存在,很可能會(huì)為未來的以太網(wǎng)發(fā)展帶來新的契機(jī)。
AI與HPC廠商重新定義以太網(wǎng)下一代標(biāo)準(zhǔn)
那么為何以太網(wǎng)需要UEC這樣一個(gè)組織呢?這就不得不提到現(xiàn)在盛行的大規(guī)模AI計(jì)算了。隨著訓(xùn)練AI模型對(duì)效率和成本的追求,無論是GPT、PALM這樣的大語言模型,還是DLRM這樣的推介系統(tǒng),都需要在成千上萬塊GPU上進(jìn)行訓(xùn)練,其中網(wǎng)絡(luò)的重要性愈發(fā)顯著。
UEC聯(lián)盟LOGO / UEC
傳統(tǒng)的以太網(wǎng)在這樣的負(fù)載上有諸多優(yōu)勢(shì),比如通用、多供應(yīng)商的生態(tài)系統(tǒng),包括以太網(wǎng)網(wǎng)關(guān)、NIC、線纜、光模塊、管理工具和軟件等等。其次,對(duì)于運(yùn)營以太網(wǎng)而言,已經(jīng)有了一套成熟的試驗(yàn)、測(cè)量和部署流程,也可以擴(kuò)展到機(jī)架級(jí)、機(jī)房級(jí)或數(shù)據(jù)中心級(jí)。
但UEC認(rèn)為,未來面對(duì)AI和HPC的以太網(wǎng)絡(luò)還需要一些改進(jìn),比如逐包負(fù)載均衡、靈活的交付順序、更現(xiàn)代化的擁塞控制機(jī)制和端到端遙測(cè)等。UEC目前有四個(gè)工作組,分別為物理層、鏈路層、傳輸層和軟件層。
其中物理層工作組和鏈路層工作組負(fù)責(zé)開發(fā)提高以太網(wǎng)性能、延遲和管理的規(guī)范,傳輸層工作組開發(fā)專用于AI/HPC的大吞吐量、低延遲和高擴(kuò)展性規(guī)范,軟件層工作組則負(fù)責(zé)開發(fā)不同AI/HPC應(yīng)用的軟件、API或開源代碼。像博通之類的芯片模組廠商,也都會(huì)在未來推出符合UEC規(guī)范的以太網(wǎng)交換機(jī)、NIC等。
直接對(duì)標(biāo)英偉達(dá)InfiniBand
從聯(lián)盟成員以及該技術(shù)的定位我們還能看出一些端倪,比如英偉達(dá)、谷歌和亞馬遜這樣的廠商并沒有加入。這是因?yàn)檫@三家更愿意發(fā)展自己的專有優(yōu)勢(shì)技術(shù),而非加入聯(lián)盟去做通用標(biāo)準(zhǔn)。比如英偉達(dá)的Infiniband在HPC與AI領(lǐng)域已經(jīng)站穩(wěn)了腳跟,而谷歌的TPUv4則引入了內(nèi)部自研的光電交換技術(shù)OCS,亞馬遜則更傾向于使用自己的Nitro系統(tǒng)來為HPC與ML應(yīng)用提供支持。
這些自研方案固然可以用于極大提升競(jìng)爭(zhēng)力,但對(duì)于部分大規(guī)模云服務(wù)廠商來說,他們很討厭這種綁定單一供應(yīng)商的做法,而且其協(xié)議也不是最通用的以太網(wǎng),所以他們這才開始聯(lián)手對(duì)以太網(wǎng)進(jìn)行AI與HPC時(shí)代下的改造,以求打破Infiniband可能存在的壟斷優(yōu)勢(shì)。
除了亞馬遜和谷歌這些選擇的云服務(wù)廠商以外,其他幾家廠商的最大競(jìng)爭(zhēng)對(duì)手自然而然地變成了英偉達(dá),他們?cè)谶@之前或多或少也有參與過互聯(lián)方案的開發(fā)。比如HPE,他們的CraySlingshot也是HPC系統(tǒng)中常見的互聯(lián)技術(shù)之一,同時(shí)也是以太網(wǎng)技術(shù)的超集變體之一,當(dāng)下TOP500的不少超級(jí)計(jì)算機(jī)中用的仍是這一系統(tǒng)。而HPE則表示,他們支持UEC的目的是保證CraySlingshot能夠在一個(gè)開放的生態(tài)系統(tǒng)中運(yùn)行,同時(shí)符合UEC標(biāo)準(zhǔn)的NIC也能夠享受到Slingshot的部分性能和擴(kuò)展性優(yōu)勢(shì)。
寫在最后
考慮到UEC才成立沒多久,所以相關(guān)的標(biāo)準(zhǔn)和技術(shù)都處于早期開發(fā)階段,第一版草案很可能會(huì)要到明年才能面世,至于第一批符合標(biāo)準(zhǔn)的產(chǎn)品,也需要等待立項(xiàng)開發(fā)以及后續(xù)的市場(chǎng)驗(yàn)證。不過這也恰好展現(xiàn)AI計(jì)算與HPC市場(chǎng)的一個(gè)縮影,那就是有的廠商在不斷推進(jìn)專有化,而有的廠商則一直追求開放標(biāo)準(zhǔn)。
-
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5605瀏覽量
175132
發(fā)布評(píng)論請(qǐng)先 登錄
英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價(jià)下跌超8%
工業(yè)以太網(wǎng)磁致伸縮位移傳感器

英偉達(dá)邁絡(luò)思以太網(wǎng)光模塊的介紹和型號(hào)梳理


加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范最新進(jìn)展(2024Q4)

今日看點(diǎn)丨 UALink聯(lián)盟正式成立,與英偉達(dá)NVLink展開競(jìng)爭(zhēng);FPGA大廠萊迪思半導(dǎo)體宣布重組
車載以太網(wǎng)的整體架構(gòu)解析

RIGOL車載以太網(wǎng)物理層電氣接口一致性測(cè)試解決方案


英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

Test House-第三方測(cè)試認(rèn)證服務(wù)——以太網(wǎng)一致性PMA測(cè)試案例講解#車載以太網(wǎng)
AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500億
英偉達(dá)或面臨重大技術(shù)性拋售 英偉達(dá)市值一夜蒸發(fā)1.4萬億

評(píng)論