一年一度的中國(guó)電子信息博覽會(huì)(CITE)在深圳舉辦。
借著這個(gè)電子信息產(chǎn)業(yè)最新產(chǎn)品和技術(shù)的國(guó)家級(jí)平臺(tái),我們將自研的(也是業(yè)內(nèi)最尖端的)800G 51.2T RoCE 交換機(jī)首次帶進(jìn)了展會(huì)現(xiàn)場(chǎng),并與華南地區(qū)的上下游企業(yè),區(qū)域集成商合作伙伴進(jìn)行了高密度的面對(duì)面交流。
短短三天,六米見(jiàn)方的展臺(tái)里,我們經(jīng)歷了一次次來(lái)訪者的試探、不解,甚至當(dāng)面挑戰(zhàn),直到與我們建立起技術(shù)信任、向我們發(fā)出高層交流甚至現(xiàn)場(chǎng)測(cè)試的邀約。
這些有著不同技術(shù)市場(chǎng)背景和工作經(jīng)歷的來(lái)訪者,往往理解行業(yè)、了解客戶、知道問(wèn)題、渴望答案——他們或在星融元的展臺(tái)上找到了答案,或?yàn)樾侨谠某掷m(xù)創(chuàng)新帶來(lái)了啟發(fā)。

“都沒(méi)聽(tīng)說(shuō)過(guò)你們公司,有案例嗎”
此次展會(huì)多數(shù)都是AI服務(wù)器系統(tǒng)集成商,其中一位來(lái)訪者之前都是將服務(wù)器直接配置IB交換機(jī)整體打包給客戶。年初由于DeepSeek的爆火他們接觸到不少小規(guī)模算力組網(wǎng)需求,而當(dāng)前國(guó)際市場(chǎng)環(huán)境下,采購(gòu)英偉達(dá)IB交換機(jī)總歸有點(diǎn)風(fēng)險(xiǎn)(別說(shuō)之前還遭遇過(guò)6個(gè)月交付周期+超預(yù)算的困境)。他見(jiàn)我們是做RoCE網(wǎng)絡(luò)的,于是帶著存疑的態(tài)度前來(lái)咨詢。
“都沒(méi)聽(tīng)過(guò)你們公司,你們的產(chǎn)品在DeepSeek推理網(wǎng)有案例嗎?”
接待他的同事結(jié)合自己對(duì)DeepSeek開(kāi)源模型理解,就著剛剛完成的基于星融元CX732Q-N(400G)的詳細(xì)組網(wǎng)方案給這位集成商介紹起來(lái)——我們的組網(wǎng)方案比起其它RoCE友商64口400G和32口400G成本更優(yōu);又如我們此前為沐曦C500 DeepSeek做的組網(wǎng)方案,一臺(tái)機(jī)器可以將訓(xùn)練網(wǎng)、存儲(chǔ)網(wǎng)、業(yè)務(wù)網(wǎng)融合,簡(jiǎn)單到網(wǎng)絡(luò)即插即用,完全可以替換IB,成本至少降低了三分之一;結(jié)合最近中美關(guān)稅政策,能降低一半。

至于性能,我們直接向他展示CX-N系列交換機(jī)與IB在AI智算,HPC和分布式存儲(chǔ)等場(chǎng)景的多個(gè)對(duì)比數(shù)據(jù)(–>測(cè)試報(bào)告參考)。一番溝通下來(lái),這位項(xiàng)目經(jīng)理直接與我們共享了之前給某運(yùn)營(yíng)商的DeepSeek AI硬件基礎(chǔ)設(shè)施報(bào)價(jià), 其中全套IB的網(wǎng)絡(luò)價(jià)格直接與采購(gòu)的AI服務(wù)器價(jià)格相近了,導(dǎo)致客戶認(rèn)為網(wǎng)絡(luò)成本太高而沒(méi)能順利落單。
再細(xì)細(xì)核算一波,如果當(dāng)時(shí)用我司設(shè)備組網(wǎng),應(yīng)該就能符合客戶預(yù)期了。
“Hash不均你們?cè)趺唇鉀Q”
有位算力行業(yè)的客戶來(lái)到我們展臺(tái),他雖非網(wǎng)絡(luò)工程師,但對(duì)RoCE網(wǎng)絡(luò)在算力場(chǎng)景下的IB替代趨勢(shì)和面臨的一些挑戰(zhàn)已有不少了解。
與那位AI服務(wù)器系統(tǒng)集成商類似,他也問(wèn)到了我們的RoCE網(wǎng)絡(luò)相對(duì)其他的廠家優(yōu)勢(shì)所在,不過(guò)要更加具體。
“比如對(duì)于大模型中常見(jiàn)的hash不均,你們會(huì)怎么解決?”。他表示一般廠商會(huì)采用例如調(diào)整哈希因子之類的方式,但僅以他本人在項(xiàng)目中的感知,實(shí)際效果非常有限,不足以滿足需求,想知道我們是否還有其他辦法。
答案當(dāng)然是肯定的,這幾乎也是每個(gè)算力網(wǎng)絡(luò)運(yùn)維架構(gòu)師都會(huì)問(wèn)到我們的問(wèn)題。具體來(lái)說(shuō),如果以軟件方式實(shí)現(xiàn),我們完全可以采用“主動(dòng)規(guī)劃”的思路為每條業(yè)務(wù)流提前規(guī)劃路徑,預(yù)先設(shè)置,生成腳本一鍵下發(fā),就像提前給每輛車固定住了行駛的路線并且自動(dòng)為客戶設(shè)備加載路由條目,這便是開(kāi)放網(wǎng)絡(luò)的技術(shù)路線帶給客戶最直觀的價(jià)值體現(xiàn)之一。
除了主動(dòng)規(guī)劃,還可以結(jié)合硬件能力的實(shí)現(xiàn)類似“自動(dòng)駕駛”(動(dòng)態(tài)哈希)方案,就好比讓每輛車自動(dòng)選擇不堵車的線路和選擇多種解決hash不均的實(shí)現(xiàn)以適應(yīng)不同的使用場(chǎng)景。
可惜時(shí)間場(chǎng)地受限,我們沒(méi)法在這個(gè)鬧哄哄的展臺(tái)長(zhǎng)時(shí)間地交流。互相交換聯(lián)系方式后我們推薦他關(guān)注微信公眾號(hào)(與他談到的產(chǎn)品動(dòng)態(tài)和技術(shù)分享多少都能在日常更新里找到),之后再預(yù)約時(shí)間深度交流,探討合作空間。
相關(guān)閱讀:解鎖AI數(shù)據(jù)中心潛力:網(wǎng)絡(luò)利用率如何突破90%?

“像IB一樣好用的RoCE網(wǎng)絡(luò),真的嗎”
一位年輕的工程師站在展臺(tái)的EasyRoCE展示屏前面看了又看,似有疑慮但不知如何開(kāi)口。主動(dòng)上前三言兩語(yǔ)聊下來(lái),我們大概了解到這位工程師是華南的一家規(guī)模很大的系統(tǒng)集成商的網(wǎng)絡(luò)方案架構(gòu)師,這家集成商在網(wǎng)絡(luò)方面的主要業(yè)務(wù)之一是為客戶提供基于IB的網(wǎng)絡(luò)方案,應(yīng)用場(chǎng)景主要是高性能計(jì)算和最近兩年爆火的AL/ML網(wǎng)絡(luò)。
吸引這位工程師流連在星融元展臺(tái)的主要原因是EasyRoCE提供的簡(jiǎn)捷部署和整體監(jiān)控方案。作為一位技術(shù)從業(yè)人員,這位工程師對(duì)RoCE技術(shù)、方案與產(chǎn)品已有很深入的理解,但是往往在考察了市面上現(xiàn)有的方案,考慮到的部署、實(shí)施、運(yùn)維、監(jiān)控等環(huán)節(jié)的挑戰(zhàn)之后,就被勸退了。
“我們的很多現(xiàn)場(chǎng)工程師往往只具備最基礎(chǔ)的運(yùn)維能力,不能要求他們具備在現(xiàn)場(chǎng)去分析、定位交換機(jī)的隊(duì)列、水線以及它們之間復(fù)雜關(guān)聯(lián)的能力,他們更需要在問(wèn)題發(fā)生的時(shí)候能夠一眼就看到故障點(diǎn)在哪里、然后快速解決……”,這位年輕人如是說(shuō)。
在了解了EasyRoCE的工具集的各項(xiàng)能力之后,他表示能夠感覺(jué)到這些工具解決的問(wèn)題真的是在很多方案中都遇到過(guò)的。
“你們這個(gè)方案是不是可以替換UFM了?”
的確,EasyRoCE工具集可以說(shuō)就是星融元RoCE方案的“UFM”。我們將自己在過(guò)往兩三年中,在AI/ML的RoCE網(wǎng)絡(luò)部署中踩過(guò)的坑、碰到的問(wèn)題,結(jié)合我們的技術(shù)能力,全部工具化了,通過(guò)這些工具將RoCE賦能給合作伙伴和最終用戶。
像IB一樣好用的RoCE網(wǎng)絡(luò),這一點(diǎn),我們來(lái)真的。

“這對(duì)IT運(yùn)維排障人員太友好了!”
還是有關(guān)EasyRoCE。
在給某華南地區(qū)數(shù)據(jù)中心IT負(fù)責(zé)人介紹EasyRoCE多個(gè)小工具的時(shí)候,他看到光模塊地圖立刻叫了暫停,跟我們確定地圖上的不同顏色是否表示交換機(jī)的光模塊的運(yùn)行狀態(tài)。在得到肯定答復(fù)后他忍不住感嘆:再也不用收到網(wǎng)絡(luò)故障通知后,不管三七二十一先挨個(gè)ssh到交換機(jī)上去show一下全局接口狀態(tài)了。“通過(guò)光模塊地圖一眼就可以排除物理因素,并且直觀定位故障模塊,這個(gè)東西對(duì)IT運(yùn)維排障人員太友好了!”

“幾百萬(wàn)的設(shè)備怕是還不如你們的SONiC交換機(jī)”
一位國(guó)內(nèi)某量化交易公司的一線工程師在前臺(tái)拿著彩頁(yè)仔細(xì)看了好一會(huì)兒,才指著”高精度監(jiān)控”向我們發(fā)問(wèn)。算力系統(tǒng)經(jīng)常出現(xiàn)毫秒級(jí)延遲波動(dòng),傳統(tǒng)網(wǎng)管工具完全無(wú)法定位。于是我們引導(dǎo)他前往展示區(qū),結(jié)合遠(yuǎn)程演示環(huán)境和數(shù)據(jù),現(xiàn)場(chǎng)介紹如何捕捉由微突發(fā)引發(fā)的丟包。
“原來(lái)我們每年花幾百萬(wàn)買(mǎi)的’高端設(shè)備’,精度還不如你們一臺(tái)白盒交換機(jī)!” 雖不知他們到底買(mǎi)了什么高端設(shè)備,但得到這樣的評(píng)價(jià)我們還是十分高興的,也期待后續(xù)有機(jī)會(huì)在他們的新建網(wǎng)絡(luò)中展示開(kāi)放網(wǎng)絡(luò)的更大潛力。
“這小盒子玩得挺花,說(shuō)不定我能用上”
800G 交換機(jī)之外,我們還帶了一臺(tái)半寬的開(kāi)放硬件平臺(tái):ET2500。這款設(shè)備我們尚未正式在國(guó)內(nèi)市場(chǎng)發(fā)布,初步定位的場(chǎng)景是部署在企業(yè)出口,作為算網(wǎng)融合開(kāi)放網(wǎng)關(guān)承擔(dān)從路由器、防火墻到網(wǎng)絡(luò)流量分析器的全部功能,替代原本用價(jià)格不菲的多臺(tái)專用設(shè)備串聯(lián)而成的出口架構(gòu)。
不過(guò),它的玩法絕不止于此——小小的盒子提供1G/2.5G/10G接口,內(nèi)置了PoE模塊、PTP模塊、5G/LTE模塊,還能選配AI 加速卡和WiFi7/6E模塊和外置天線,加之上層運(yùn)行的標(biāo)準(zhǔn)Linux和我們定制優(yōu)化的DPDK/VPP軟件包(已開(kāi)源),給足了用戶想象空間。

有位路過(guò)的客戶轉(zhuǎn)頭一瞥就被我們的ET2500外觀吸引住了,左右打量半天,開(kāi)口問(wèn)的第一個(gè)問(wèn)題是,這個(gè)小盒子能幫我做算力調(diào)度嗎?
接著就暢談他們的業(yè)務(wù)場(chǎng)景:算力調(diào)度網(wǎng)絡(luò),把分布在全國(guó)的零散算力資源統(tǒng)一調(diào)度起來(lái),分布式計(jì)算的場(chǎng)景和ET2500(以及此前發(fā)布的 CX102S-DPU)天然契合——小盒子里面的三顆芯片協(xié)同工作,可以幫他們極大減少邊緣部署的設(shè)備數(shù)量和復(fù)雜度。經(jīng)過(guò)一番業(yè)務(wù)場(chǎng)景的溝通和探討之后,他對(duì)這款小盒子非常感興趣,留下了聯(lián)系方式并表示后續(xù)要再交流探討。
電博會(huì)上與星融元偶遇的這些人,那些事,再一次堅(jiān)定了我們用高效、實(shí)用的開(kāi)放網(wǎng)絡(luò)技術(shù)棧幫助各行業(yè)客戶切實(shí)解決問(wèn)題的信心,并將其作為星融元在這個(gè)充滿著挑戰(zhàn)和機(jī)遇的全球市場(chǎng)上不變的生存與發(fā)展之道。

-
網(wǎng)絡(luò)交換機(jī)
+關(guān)注
關(guān)注
1文章
69瀏覽量
16302 -
算力
+關(guān)注
關(guān)注
2文章
1133瀏覽量
15412 -
智算中心
+關(guān)注
關(guān)注
0文章
86瀏覽量
1968
發(fā)布評(píng)論請(qǐng)先 登錄
算力網(wǎng),是否像電力網(wǎng)一樣?

STM32CubeIDE編譯設(shè)置是否有像keil一樣有編譯后執(zhí)行Bat腳本的功能和設(shè)置?
網(wǎng)線可以像電線一樣接嗎
STM32CUBEide有沒(méi)有像KEIL一樣可以自己指定函數(shù)注釋模板的方法?
Stm32CubeIDE能像Keil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?
請(qǐng)問(wèn)激光投影中激光光源能否像LED一樣瞬時(shí)開(kāi)關(guān)?
請(qǐng)問(wèn)DAC5682寄存器如何設(shè)置,有像DAC5682 EVM一樣有軟件程序設(shè)置嗎?
RoCE與IB對(duì)比分析(二):功能應(yīng)用篇

RoCE與IB對(duì)比分析(一):協(xié)議棧層級(jí)篇

評(píng)論