在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

中科馭數DPU助力大模型訓練和推理

馭數科技 ? 來源:馭數科技 ? 2025-02-19 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著深度學習技術的快速發展,大模型(如GPT、BERT等)在自然語言處理、計算機視覺等領域取得了顯著成果。然而,大模型的參數量和計算量極其龐大,傳統的硬件架構或者單臺設備(如單個GPU)難以滿足其計算需求。大模型的特點如下:

1. DeepSeek-R1模型的參數量高達6710億,訓練過程需要數萬臺GPU協同工作。

2. 計算需求:大模型的前向傳播、反向傳播和梯度更新涉及大規模的矩陣運算,單設備無法在合理時間內完成。

3. 內存需求:大模型的參數和中間結果需要大量內存存儲,單設備的內存容量有限。

4. 數據需求:大模型的訓練需要海量數據,單設備難以高效處理。

為提高大模型的計算效率,必須充分利用矩陣和向量運算的內在并行性。大模型訓練的核心流程:前向傳播、反向傳播和梯度更新,均依賴大規模矩陣計算,這為分布式并行提供了天然優勢。目前,主要的并行計算策略包括:

a)數據并行(Data Parallelism):將訓練數據拆分成多個批次或子集,分配到多個設備上執行局部計算。各設備獨立計算梯度后,通過梯度同步或聚合機制實現全局參數更新。

b)模型并行(Model Parallelism):將模型按照參數或模塊劃分,分布到多臺設備上進行計算。當模型單個設備內存難以容納時,模型并行可以有效擴展計算規模。

c)流水線并行(Pipeline Parallelism):將模型按照層級或階段劃分成多個片段,各設備依次負責不同層的計算。數據在設備間依次傳遞,形成一條類似流水線的處理路徑,從而在不同處理階段實現并行性。

分布式計算通過多種并行策略的協同應用,不僅可以突破單設備算力和內存的限制,還能顯著加速大規模深度學習模型的訓練。

在大模型訓練和推理中,GPU雖然是核心計算單元,但其計算能力往往受到數據管理、通信和存儲等任務的限制。DPU(Data Processing Unit,數據處理單元)作為一種新型硬件加速器,正在成為大模型訓練和推理的重要助力。DPU的出現正是為了解決這些問題:

a)卸載GPU的計算負擔:GPU主要負責矩陣運算等核心計算任務,但數據加載、預處理、通信等任務會占用其資源。DPU可以接管這些任務,通過高速I/O接口直接從存儲設備讀取數據,減少CPU的介入。大模型訓練需要頻繁讀取和寫入大量數據(如模型參數、中間結果、數據集等),傳統的存儲系統可能成為瓶頸。DPU支持NVMe over Fabric/RDMA等高速存儲協議,能夠直接從遠程存儲設備讀取數據。讓GPU專注于計算,從而提高整體效率。

b)優化數據預處理與檢索:大模型在訓練階段需要大量的預處理(如圖像增強、文本分詞等),在推理階段也需要通過知識庫進行檢索增強,這些操作通過遠程訪問分布式文件系統來完成。在CPU處理模式下,遠端存儲訪問協議的處理成為瓶頸。我們通過DPU進行遠端存儲訪問協議的卸載,提高數據讀寫的效率,提供比CPU更高的吞吐量和更低的延遲。

c)加速分布式訓練中的通信:分布式訓練中,GPU之間的通信(如梯度同步)會消耗大量時間。DPU可以優化通信任務,支持高效的All-Reduce操作,減少通信延遲。DPU內置專用的通信引擎,使能GPU Direct RDMA,減少CPU的干預,實現超高帶寬、低延遲的GPU間通信。

d)提高能效比:DPU專門針對數據管理和通信任務進行了優化,能夠以更低的功耗完成這些任務,從而降低整體能耗

中科馭數作為國內領軍的DPU芯片和產品供應商,憑借多年在DPU領域的積累,不斷推陳出新,基于公司全自研的國產芯片K2-Pro,推出應用于智算中心的系列產品和方案。

0d0f4986-ede4-11ef-9310-92fbcf53809c.png

圖1 : 中科馭數K2-Pro

K2-Pro芯片的網絡處理能力,可以很好的支撐國產化推理集群的各種應用需求,在中科馭數自建的全國產化推理集群中,很好的承擔了高通量網絡傳輸,云化流表卸載與分布式資源快速加載的任務。

同時,在AI模型訓練方向,中科馭數完全自主研發的RDMA網卡助力數據中心高速網絡連接,確保大規模模型的數據傳輸效率,減少通信延遲,提升整體計算性能。RDMA性能達到200Gbps。釋放CPU算力,彌補國產CPU性能不足問題。提供微秒級時延和百G級帶寬以及千萬級別的IOPS存儲訪問能力,滿足模型計算對數據快速加載的性能要求。

近日,中科馭數基于全國產化CPU、GPU、DPU 三U一體設備本地化部署了DeepSeek模型,系統中通過國產CPU實現整體業務調度與主要服務進程運行,采用國產GPU完成模型推理運算,由中科馭數DPU進行設備裸金屬業務管理以及云化網絡/存儲能力卸載提速。該系統底層采用全國產化的3U一體服務器搭建,在兼顧安全性與低成本的同時,可以高效運行DeepSeek-V3與DeepSeek-R1等多個AI推理模型系統。中科馭數通過這種方式完成多個AI模型適配,打通全國產化三U一體算力底層支撐,能夠幫助AI應用在落地過程中實現更好的數據隱私性保護與抵御外部風險的能力,同時也積極推動產業鏈協同與資源優化整合。

0d2e953e-ede4-11ef-9310-92fbcf53809c.png

圖2 :中科馭數智算中心解決方案

DPU通過卸載GPU的計算負擔、優化數據預處理、加速通信和存儲任務,正在成為大模型訓練和推理的重要助力。馭數的DPU產品憑借其高性能、低功耗和可擴展性,為大模型訓練和推理提供了強有力的支持。隨著深度學習技術的進一步發展,類似DeepSeek大模型的興起,以及由此帶來對智算資源的大幅優化,給國產GPU和CPU實現高效大模型訓練和推理的大規模部署帶來巨大可能和期盼。

同時,智算租賃因為DeepSeek模型對于部署資源的優化,讓最終從“看著挺美”變成“用著挺美”。很多用戶開始嘗試租賃智能算資源,這要求智算資源可以按需快速部署。中科馭數的DPU產品,通過流程簡化和存儲卸載,實現了裸金屬部署時間從傳統的30分鐘優化到3分鐘,大大便利了資源的反復利用,也極大地提升了客戶訂閱的體驗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DPU
    DPU
    +關注

    關注

    0

    文章

    393

    瀏覽量

    24815
  • 中科馭數
    +關注

    關注

    0

    文章

    133

    瀏覽量

    4317
  • 大模型
    +關注

    關注

    2

    文章

    3086

    瀏覽量

    3971

原文標題:中科馭數DPU助力大模型訓練和推理

文章出處:【微信號:yusurtech,微信公眾號:馭數科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科DPU全棧產品亮相福州博會,賦能智算時代算力基建

    會”)也拉開帷幕。共有150多家企業參展,展會吸引了八萬多名觀眾參觀。作為國內DPU領域領軍企業,中科攜三大產品線亮相展會,其創新的DPU
    的頭像 發表于 05-23 11:01 ?171次閱讀
    <b class='flag-5'>中科</b><b class='flag-5'>馭</b><b class='flag-5'>數</b>攜<b class='flag-5'>DPU</b>全棧產品亮相福州<b class='flag-5'>數</b>博會,賦能智算時代算力基建

    中關村泛聯院一行來訪中科

    中關村泛聯移動通信技術創新應用研究院(以下簡稱“中關村泛聯院”)專職副院長金毅敦一行來訪中科,雙方探討了6G技術發展現狀,以及DPU在6G場景的應用機會。
    的頭像 發表于 04-14 10:26 ?485次閱讀

    中科受邀出席2025中關村論壇

      2025中關村論壇年會3月27日至31日在京舉辦,中科作為高性能芯片企業代表受邀參與中關村論壇,在位于中關村展示中心的常設展中展出公司最新的DPU芯片產品。
    的頭像 發表于 04-07 09:57 ?421次閱讀

    中科受邀參與華泰證券春季投資峰會 分享DPU在AI領域的應用

    華泰證券2025年春季投資峰會以“破局、重構、裂變”為主題,探討全球變局下的新趨勢。中科高級副總裁張宇受邀參與,分享DPU的產業應用。
    的頭像 發表于 03-29 16:50 ?313次閱讀

    合肥市科技局蒞臨中科調研

    近日,合肥市科技局副局長呂波一行來訪中科考察調研。
    的頭像 發表于 02-27 14:27 ?607次閱讀

    中科K2-Pro芯片助力智算中心創新

    中科,作為國內DPU芯片與產品供應的領軍者,憑借在DPU領域的深厚積累,不斷推出創新產品。近日,公司基于全自研的國產芯片K2-Pro,推
    的頭像 發表于 02-19 15:00 ?527次閱讀

    中科獲批設立博士后科研工作站 加強DPU產學研合作

    的設立是對企業在科技創新和高水平人才隊伍建設的高度肯定和大力支持,將進一步推動中科在科研創新、DPU產學研合作、DPU高層次人才培養等領
    的頭像 發表于 12-31 18:56 ?869次閱讀
    <b class='flag-5'>中科</b><b class='flag-5'>馭</b><b class='flag-5'>數</b>獲批設立博士后科研工作站 加強<b class='flag-5'>DPU</b>產學研合作

    中科憑借在DPU芯片領域的積累被認定為北京市知識產權優勢單位

    近日北京市知識產權局公布了2024年擬認定北京市知識產權優勢單位名單,中科憑借在DPU芯片領域積累的知識產權成果以及在知識產權創造、運用、保護和管理等方面的優勢,被認定為北京市知識
    的頭像 發表于 12-31 18:49 ?736次閱讀
    <b class='flag-5'>中科</b><b class='flag-5'>馭</b><b class='flag-5'>數</b>憑借在<b class='flag-5'>DPU</b>芯片領域的積累被認定為北京市知識產權優勢單位

    中科被認定為北京市知識產權優勢單位

    近日北京市知識產權局公布了2024年擬認定北京市知識產權優勢單位名單,中科憑借在DPU芯片領域積累的知識產權成果以及在知識產權創造、運用、保護和管理等方面的優勢,被認定為北京市知識
    的頭像 發表于 12-31 10:35 ?545次閱讀

    中科受邀出席華泰證券金融科技峰會

    近日中科作為創新生態伙伴,受邀參與華泰證券在香港舉辦的2024年度金融科技峰會。中科創始
    的頭像 發表于 12-13 15:19 ?613次閱讀

    中科受邀出席中國科學院大學校友論壇

    分享《DPU——連接算力基礎設施的“樞紐”》主題演講,以其深厚的學術背景與豐富的行業經驗,向與會嘉賓分享中科DPU芯片如何成為鏈接和優化
    的頭像 發表于 09-29 09:45 ?615次閱讀

    中科華中總部項目落戶光谷

    近日,國內DPU芯片領域的領軍企業——中科(北京)科技有限公司與東湖高新區正式簽署合作協議,標志著中科
    的頭像 發表于 09-19 17:35 ?868次閱讀

    中科數分析DPU在云原生網絡與智算網絡中的實際應用

    CCF Chip 2024,精彩不能停!7月21日下午,中科在第二屆中國計算機學會(CCF)芯片大會的“專屬時刻”仍在繼續,
    的頭像 發表于 08-02 11:21 ?1113次閱讀

    中科DPU是構建高效智算中心基礎設施的必選項

    日前,在江蘇省未來網絡創新研究院、網絡通信與安全紫金山實驗室舉辦的“2024智算網絡技術與應用創新峰會”上,中科作為DPU算力基礎設施領軍企業,受邀出席本次峰會。
    的頭像 發表于 07-08 10:51 ?996次閱讀

    中科發布第三代DPU芯片K2 Pro,較上一代能耗降低30%

    電子發燒友網報道(文/李彎彎)近日,中科(北京)科技有限公司(以下簡稱“中科”)在北京發
    的頭像 發表于 07-01 07:32 ?4219次閱讀
    主站蜘蛛池模板: 久久综合性| 4455四色永久免费 | 国产精品美女自在线观看免费 | 看全色黄大色大片免费久久 | 国产三级国产精品国产普男人 | 男女交性视频播放视频视频 | 亚洲乱码一区二区三区在线观看 | 色视频在线网站 | 欧美日本一区二区三区 | 岛国午夜精品视频在线观看 | 日本一区二区不卡在线 | 亚洲五月激情综合图片区 | 亚洲午夜精品久久久久久抢 | 欧美一区二区三区黄色 | 美女扒开尿口给男人桶动态图 | 国产精品午夜国产小视频 | xxxxxhd69日本护士| 日韩爽片| 天天综合色网 | 网站在线观看视频 | 欧美日操 | 天天做天天玩天天爽天天 | 在线电影你懂得 | 精品国产第一国产综合精品gif | 夜夜春色 | 黄色免费网站在线 | 日韩成人影院 | 国内精品久久久久影 | 欧洲精品不卡1卡2卡三卡四卡 | 国产精品视频网站你懂得 | 97天天摸天天碰天天爽 | 国产亚洲精品美女2020久久 | 亚洲色播永久网址大全 | 天天色天天做 | 色激情综合网 | 热re66久久精品国产99热 | 手机看片1024欧美 | 男女同床爽爽视频免费 | sss欧美华人整片在线观看 | 最新版天堂资源8网 | 起碰成人免费公开网视频 |