以“發展新質生產力,計算引領未來”為主題的第二十一屆中國計算機大會(CNCC2024)在橫店圓明新園盛大開幕,逾萬名計算機行業翹楚參會。本屆大會邀請到了17位國內院士,800余位國內外頂尖學者、企業技術精英,帶來特邀報告、大會論壇、138場專題論壇等活動。10月25日下午,作為2024 CNCC技術論壇的重要組成部分,中科馭數成功舉辦第六屆DPU技術論壇,本次論壇聚焦“DPU在智算網絡、云原生網絡等場景的技術趨勢和應用實踐”,匯聚了眾多行業內的頂級專家與學者,共同探討DPU技術的最新進展及其在高速網絡、高速存儲、人工智能、云計算等數據計算密集型場景的應用潛力。
論壇主席、中國科學院計算技術研究所研究員李曉維在開場致辭中表示,隨著云計算、人工智能等領域的快速發展,對于高效數據處理的需求日益增長,而DPU作為新一代的數據處理單元,正逐漸成為解決這些挑戰的關鍵技術之一。DPU能夠顯著提升數據處理速度,在算力、存力、運力等多個方面同時扮演著非常重要的角色,其在高性能云數據中心中的應用落地與推廣,對于數據中心乃至數字經濟的發展至關重要。
▲論壇主席李曉維開場致詞
中國電子云云產品線研發副總裁劉年超發表了《SmartNIC/DPU在AI云原生環境中應用的實踐和思考》的主題演講,分享了SmartNIC/DPU發展背景及歷程、電子云SmartNIC/DPU研究和實踐、SmartNIC/DPU現狀和未來的思考。他指出,SmartNIC、DPU、IPU抑或是CIPU,雖然在命名方式方面缺乏統一的標準,其本質是以CPU為中心的體系架構向以數據為中心的體系架構轉變的大勢所趨。新一代 DPU/IPU 設備的共同特點是它們采用易于編程的多核 CPU、先進的網絡接口以及一組強大的網絡、存儲和安全加速引擎,可以進行編程以執行多個軟件定義的硬件加速功能。
中國電子云目前也在網絡架構和軟硬件方面積極創新嘗試,自研基于云原生的雨燕網絡架構,結合國產自主可控DPU方案,實現裸金屬、虛擬機、容器統共享網絡和存儲資源池,提升虛擬機網絡包傳輸率達到200萬PPS,提升集群CPU利用率至70%以上,達到了良好降本增效目標。目前,中科馭數FLEXFLOW-2200T、CONFLUX-2200E以及CONFLUX-2200P產品已與中國電子云的CClinux操作系統及基于云原生分布式云平臺完成深度適配。
▲中國電子云云產品線研發副總裁劉年超發表演講
中科馭數高級副總裁張宇在《基于DPU的高性能云底座》演講中談及,云是算力供給的最普遍形式。當下高性能云計算基礎設施建設的主要挑戰包括規模化落地、異構算力融合、資源池化。DPU作為支撐云基礎設施的核心要素,其價值在于串聯網絡、存儲、安全、虛擬化、裸金屬和容器等業務系統。
中科馭數基于IaaS on DPU (IoD) 技術,打造了一套統一管理計算和裸金屬節點的解決方案,實現了99%的服務器資源直接服務于客戶業務,單機吞吐量提升4倍,存儲IOPS性能提升1.5倍。特別是在券商低時延服務中,通過DPU卸載代理流量和用戶態協議棧,將業務訪問時延降至130微秒,降低70%,并減少服務器CPU消耗達20%。此外,中科馭數的解決方案還實現了公有云裸金屬服務的分鐘級交付,無需PXE或操作系統安裝,顯著提升了配置的簡易性和靈活性。
▲中科馭數高級副總裁張宇發表演講
青云科技智算解決方案總監傅帥在《借助DPU實現算力的靈活調度與管理》演講中指出,算力基礎設施是AI發展的基石,青云科技在智算中心建設中,利用DPU優化大型異構算力中心的運營效率,打通算力形態、網絡安全、用戶管理、計量計費等關鍵環節,為智算中心的高效運行提供有力支持。最新升級的青云AI智算產品和服務,能夠靈活交付私有云、邊緣云、分布式云及算力云服務,增強國產計算支持、GPU切分、裸金屬及DPU等能力。特別是通過DPU在裸金屬服務中的應用,青云科技實現了容器調度、節點管理、監控服務等功能的優化,顯著提升了裸金屬性能和整體系統的可靠性。
▲青云科技智算解決方案總監傅帥發表演講
紫金山實驗室研究員時定兵在《可編程網絡探索與實踐》演講中指出,面對AI大模型時代的挑戰,構建高性能算力底座需要計算、網絡、存儲和系統的協同工作。開放網絡設備將是未來網絡的核心組成部分,對網絡相關功能與流量的控制具有重要意義。
紫金山實驗室自研的白盒交換機在智算中心、算間網絡和算網協同中展現了重要的應用價值,有效支持了多種復雜場景的需求。在智算中心三網分離方案中,白盒交換機支持超寬128*400G帶寬,實現無損網絡技術(PFC/ECN/DCQCN),并通過集中流量調度(TELB)和多級負載分擔技術,提升鏈路帶寬利用率和流量均衡,確保大規模超寬無損智算中心網絡的高效運行。在算間網絡中,通過SRv6協議承載、FlexE、DetNet構建“子切片”,實現數據中心間確定性承載網絡,提供業務級差分服務和細粒度的SLA保障。在算網協同方案中,白盒交換機作為算力網關的核心設備,具備算網感知、算力路由和算網傳輸保障能力,實現算網流量的最佳調度與傳輸,支持基于SRv6、FlexE的確定性網絡算力數據傳輸。
▲紫金山實驗室研究員時定兵發表演講
中國移動研究院項目經理李婕妤雖因故未能到場,但仍然向我們共享了關于中國移動在網絡架構創新上的重要內容。面對AI大模型訓練帶來的巨大通信消耗,中國移動原創提出了GSE技術體系,通過革新以太網轉發機制,實現了高精度負載均衡、網絡層原生無損及低延遲等三大核心機制轉變。中國移動現網百卡級中試驗證結果顯示,相較于傳統的RoCE方案,GSE技術在主流模型訓練性能上平均提升了30%以上,尤其在單設備或單鏈路故障場景下,性能提升更是超過了40%。
李婕妤表示,智算中心網絡技術是依托服務器網卡、交換機、DPU芯片、轉發芯片等的一條龐大產業鏈,技術體系復雜,依賴上下游協同創新。
在圓桌論壇環節,中科馭數高級副總裁張宇、中科院計算所研究員李曉維、中國電子云云產品線研發副總裁劉年超以及紫金山實驗室研究員時定兵圍繞DPU技術的發展與應用展開了深入討論。大家一致認為,DPU市場前景廣闊,DPU技術的發展伴隨著云計算和底層基礎設施的快速迭代,尤其是在過去四年中,隨著對DPU認知的提升和應用探索的深入,DPU迎來了政策支持和市場需求增長的機遇。
對于DPU在智算中心的高性能網絡建設,嘉賓們建議加強自主研發,推動標準化進程,提升網絡的靈活性和可靠性。在DPU規模應用落地方面,行業應注重技術創新和生態建設,加強產業鏈上下游的合作,建立更多的合作平臺,促進資源共享和技術交流。未來3到5年,隨著5G、物聯網、邊緣計算等技術的不斷成熟,算力基礎設施將朝著智能化、綠色化、高效化的方向發展,DPU將在其中發揮重要作用。
▲四位嘉賓深入討論DPU技術的發展與應用趨勢
本次論壇的成功舉辦,不僅加深了產學研各界對DPU應用價值的理解,也為推動構建全面、堅實、領先的DPU技術體系奠定了基礎。我們相信,只有通過廣泛的交流合作,才能激發創新的火花,推動技術的突破和發展。中科馭數將繼續致力于DPU產品的研發和應用推廣,深化與高校、科研機構及企業的合作,共同攻克技術難題,推動標準制定,構建完善的DPU生態系統。同時不斷創新,為客戶提供更高效、更可靠的算力解決方案。期待攜手產業伙伴共同探索新技術、新模式,共同推動我國算力基礎設施邁向新的高度。
下次再會!
審核編輯 黃宇
-
計算機
+關注
關注
19文章
7662瀏覽量
90772 -
DPU
+關注
關注
0文章
393瀏覽量
24928
發布評論請先 登錄
SAE 2024汽車動力總成多元化技術論壇成功舉行
華邦電子成功舉辦三場聯合技術論壇
天馬OLED技術論壇成功舉辦
OpenHarmony城市技術論壇第11期(香港站)【智能終端操作系統技術與國際化生態構建】大咖齊聚

第三屆OpenHarmony技術大會主論壇嘉賓演講大咖金句聚焦

2024存儲技術論壇成功舉行!大咖共話從云到端AI與存儲大爆發

中科馭數分析DPU在云原生網絡與智算網絡中的實際應用
龍芯中科亮相第二屆中國計算機學會芯片大會
IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書
思爾芯亮相CCF Chip 2024,展示數字前端EDA技術
思爾芯亮相CCF Chip 2024,展示創新EDA技術與產學研合作

評論