在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepSeek扔的第二枚開源王炸是什么

A面面觀 ? 2025-02-26 11:05 ? 次閱讀

在DeepSeek啟動的“開源周”上(Open Source Week)DeepSeek將陸續開源5個代碼庫,大家關心的DeepSeek扔的第二枚開源王炸是什么?我們這里來簡單介紹一下。

DeepSeek在其開源周活動中連續扔出了兩枚震撼業界的“開源王炸”--FlashMLA與DeepEP。

在25日,也就是DeepSeek開源周的第二天,DeepSeek發布了名為DeepEP的開源代碼庫。DeepEP是全球首個專為MoE(混合專家)模型訓練和推理設計的通信庫,它的出現填補了該領域專用工具的空白。MoE模型作為一種能夠有效提升AI模型性能和擴展性的架構,近年來在自然語言處理、計算機視覺等領域得到了廣泛應用。然而,MoE模型在訓練和推理過程中,面臨著通信開銷大、算力需求高等挑戰。DeepEP正是針對這些痛點,通過優化GPU之間的信息傳輸效率,極大地緩解了從業者的算力焦慮。

業界人士多認為DeepEP是首個用于 MoE 模型訓練和推理的開源 EP 通信庫,它填補了MoE模型專用通信工具的空白,為大規模分布式AI訓練和實時推理場景提供了更高效的底層支持。

DeepEP的核心優勢在于其高效的通信機制。在傳統的分布式AI訓練中,GPU之間的通信往往成為性能瓶頸。DeepEP通過一系列創新技術,如低延遲通信協議、智能數據調度等,顯著提升了GPU之間的通信效率。這意味著,原本需要龐大算力支持的重型任務,現在可以在更少的GPU上高效完成。據DeepSeek官方介紹,使用DeepEP后,某些MoE模型的訓練速度可提升數倍,同時降低了對硬件資源的依賴。

wKgZPGe-hzaAY0kcAAFPhfhWeVs959.png

DeepEP的技術性能特點概述:

EP為Expert Parallelism(專家并行),是一種在大規模分布式AI模型訓練中使用的技術,能用于提升模型并行處理能力和訓練效率。

1、高效通信架構

支持優化的全對全通信模式,實現節點內和節點間的NVLink與RDMA互聯,提升數據傳輸效率

2、多精度與調度優化

原生支持FP8低精度運算調度,降低計算資源消耗。

3、重性能內核

據介紹,高吞吐量內核可適用于訓練和推理預填充場景,最大化數據處理能力;

4、低延遲內核

它針對推理解碼場景設計,采用純RDMA通信和自適應路由技術,減少延遲。

5、資源控制與重疊機制

通過靈活的GPU資源控制策略,實現計算與通信過程的高效重疊,避免資源閑置。

6、深度優化場景

針對NVLink到RDMA的非對稱帶寬轉發場景進行專項優化,提升異構網絡下的傳輸性能;

支持SM(Streaming Multiprocessors)數量動態控制,平衡不同任務(如訓練與推理)的吞吐量需求。

DeepEP與FlashMLA的對比

DeepSeek在其開源周活動中首個開源的項目是FlashMLA;FlashMLA讓AI大模型低成本卻有高性能。

DeepSeek扔的第二枚開源王炸是全棧通信庫DeepEP。與第一枚開源王炸FlashMLA相比,兩者在多個方面存在顯著差異。以下是對這兩者的詳細對比以及外媒的熱議:

1. 功能定位:

● DeepEP:它是全球首個面向MoE(Mixture of Experts)模型的全棧通信庫,旨在優化GPU之間的信息傳輸效率,從而極大提升AI模型的訓練與推理效率。

● FlashMLA:專為英偉達Hopper架構GPU(如H800/H100)優化的高效MLA解碼內核,旨在顯著提升AI的加速能力,特別是在處理長短句子并行任務時能夠動態調整計算資源分配,避免算力浪費。

2. 技術特點:

● DeepEP:具備高效的全員通信能力,支持NVLink與RDMA技術,提供高吞吐量的訓練預填充內核以及低延遲的推理解碼內核。原生支持FP8調度,靈活的GPU資源管理能力使得計算和通信可以重疊進行。

● FlashMLA:專為高性能顯卡設計,能夠充分挖掘顯卡性能潛力,被視為AI加速的“渦輪增壓器”。

3. 硬件兼容性:

● DeepEP:具有更廣泛的硬件兼容性,不受特定GPU架構的限制。

● FlashMLA:目前僅適配Hopper架構GPU,國產GPU的兼容性尚待驗證。

DeepSeek的這兩枚開源王炸在國際上引起了廣泛關注。外媒對DeepSeek的評價普遍較高,認為其打破了人們對人工智能研發需要“高投入、長周期”的傳統認知,提供了低成本、高效能的解決方案。同時,DeepSeek的開源策略也被視為一種促進全球科技進步的積極舉措。

具體來說,外媒對DeepEP和FlashMLA的關注點有所不同。對于DeepEP,外媒主要關注其在優化GPU通信效率、提升AI模型訓練與推理效率方面的潛力。而對于FlashMLA,外媒則更側重于其在提升AI加速能力、挖掘顯卡性能潛力方面的表現。

wKgZPGe-hzaARqqDAAE3up7dZtc800.png




DeepSeek的第二枚開源王炸DeepEP與第一枚開源王炸FlashMLA在功能定位、技術特點、硬件兼容性和開源時間等方面存在顯著差異。外媒對這兩者的評價普遍積極,認為它們為人工智能領域帶來了新的突破和進步。


我們知道每一次技術的突破都可能成為推動行業發展的關鍵力量。也能夠帶來更多產業鏈的機遇。比如AI 能力和性能不斷提升,模型的規模和復雜度持續增長,面對信息速率和密度不斷提升的AI,技術進步也會遵循摩爾定律,那硬件互連準備好了嗎?

DeepSeek啟動的“開源周”連續5天(2月24日至28日);歡迎大家繼續關注DeepSeek的大招。期待更多讓我們驚喜的東西能夠面世。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3458

    瀏覽量

    42899
  • DeepSeek
    +關注

    關注

    1

    文章

    544

    瀏覽量

    274
收藏 人收藏

    評論

    相關推薦

    FPGA+AI組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    近期,DeepSeek這個名字在AI圈徹底炸開了鍋并且關于DeepSeek的消息網絡鋪天蓋地,短視頻,朋友圈隨處可見不少網友留言稱其是“來自東方的神秘力量”又一次震撼海外人士心臟“這太瘋狂了
    發表于 03-03 11:21

    摩爾線程支持DeepSeek開源通信庫DeepEP和并行算法DualPipe

    DeepSeek開源周第四日,摩爾線程宣布已成功支持DeepSeek開源通信庫DeepEP和并行算法DualPipe,并發布相關開源代碼倉庫
    的頭像 發表于 02-28 15:58 ?137次閱讀

    云天勵飛DeepEdge10適配DeepSeek開源周“首個大招”:FlashMLA

    2 月 24 日,DeepSeek"開源周"正式啟動,并發布首個代碼庫FlashMLA……
    的頭像 發表于 02-27 11:06 ?104次閱讀
    云天勵飛DeepEdge10適配<b class='flag-5'>DeepSeek</b><b class='flag-5'>開源</b>周“首個大招”:FlashMLA

    DeepSeek宣布開源DeepGEMM

    DeepGEMM 是一個專為簡潔高效的 FP8 通用矩陣乘法(GEMM)設計的庫,具有細粒度縮放功能,在Deepseek開源周的第三天Deepseek正式宣布開源DeepGEMM。 據
    的頭像 發表于 02-26 15:33 ?535次閱讀

    DeepSeek第二枚開源是什么,跟第一有何不同?強烈引發外媒熱議

    在科技日新月異的今天,每一次技術的突破都可能成為推動行業發展的關鍵力量。近日,AI領域的獨角獸企業DeepSeek,在其開源周活動中連續扔出了兩震撼業界的“開源
    的頭像 發表于 02-26 11:10 ?399次閱讀
    <b class='flag-5'>DeepSeek</b><b class='flag-5'>扔</b>的<b class='flag-5'>第二枚</b><b class='flag-5'>開源</b><b class='flag-5'>王</b><b class='flag-5'>炸</b>是什么,跟第一<b class='flag-5'>枚</b>有何不同?強烈引發外媒熱議

    沐曦GPU跑通DeepSeek開源代碼庫FlashMLA

    今日,DeepSeek正式啟動"開源周"計劃,首發代碼庫FlashMLA一經開源即引發全網關注。截至發稿,該項目已在GitHub斬獲超7.2K Star!
    的頭像 發表于 02-25 16:25 ?334次閱讀

    百度搜索,能否將DeepSeek變成“內功”?

    實測之后,會發現百度搜索和DeepSeek稱得上“組合”
    的頭像 發表于 02-21 10:04 ?1670次閱讀
    百度搜索,能否將<b class='flag-5'>DeepSeek</b>變成“內功”?

    鴻蒙原生應用開發也可以使用DeepSeek

    ,請訪問華為開發者官網下載并安裝最新版本5.0.7.210。安裝完成后,打開DevEco Studio,創建一個新的鴻蒙應用項目,選擇適合的模板(如Empty Ability)。 第二步:安裝
    發表于 02-20 18:06

    Banana Pi開源社區基于瑞芯微RK3588開發板,DeepSeek開發利器

    Banana Pi開源社區基于瑞芯微RK3588開發板,DeepSeek開發利器
    的頭像 發表于 02-19 18:25 ?627次閱讀
    Banana Pi<b class='flag-5'>開源</b>社區基于瑞芯微RK3588開發板,<b class='flag-5'>DeepSeek</b>開發利器

    開源大模型DeepSeek的開放內容詳析

    當大家討論為什么 DeepSeek 能夠形成全球刷屏之勢,讓所有廠商、平臺都集成之時,「開源」成為了最大的關鍵詞之一,圖靈獎得主 Yann LeCun 稱其是「開源的勝利」。模型開源
    的頭像 發表于 02-19 09:48 ?559次閱讀
    <b class='flag-5'>開源</b>大模型<b class='flag-5'>DeepSeek</b>的開放內容詳析

    添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略

    的 AI 處理效率,成為部署各類 AI 模型的關鍵依托。 憑借這些卓越的硬件性能,RK3588 開發板在保持低功耗的同時,展現出強大的運算能力,無疑是部署 DeepSeek 模型的不之選,為后續的技術
    發表于 02-14 17:42

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個不同定位的大模型,其核心差異主要體現在目標場景、能力側重和技術優化方向上。以下是者的實
    發表于 02-14 02:08

    【實測】用全志A733平板搭建一個端側Deepseek算力平臺

    歸納總結。 我們再嘗試解一個一元次方程:“求解方程x^2+4x+4=0” 實測視頻如下: ? 同樣,Deepseek也是快速理清了題意,判別出了這是一個解一元次方程的題目,并給出了求解公式。 然后
    發表于 02-13 10:19

    deepseek國產芯片加速 DeepSeek的國產AI芯片天團

    遙想兩年前,ChatGPT給了世界一記AI沖擊,而DeepSeek無疑是第二記沖擊。我們不僅對DeepSeek強勁的性能所震撼,也讓遠在大洋彼岸的OpenAI、谷歌、META等一眾玩家感受到莫大壓力
    的頭像 發表于 02-10 15:07 ?1236次閱讀
    <b class='flag-5'>deepseek</b>國產芯片加速 <b class='flag-5'>DeepSeek</b>的國產AI芯片天團

    深度解析deepseek開源是什么意思

    Deepseek開源是指Deepseek項目的源代碼被公開,允許任何人免費查看、使用、修改和分發。
    的頭像 發表于 02-06 09:29 ?2541次閱讀
    主站蜘蛛池模板: 免费亚洲一区 | 深爱激情站| 国产成人99久久亚洲综合精品 | 日本最黄视频 | 天天搞夜夜爽 | 六月丁香色婷婷 | 男女性gif抽搐出入 男女性高爱潮免费的国产 男女性高爱麻豆 | 黄色国产网站 | 色猫成人网 | 成人免费观看一区二区 | 日本大黄在线观看 | 色哟永久免费 | 日本免费性| 日本xxxxbbbb| 中文字幕亚洲天堂 | 欧美特级黄 | 亚洲第一色图 | 色婷婷六月丁香七月婷婷 | 国产精品四虎在线观看免费 | 第四色激情 | 欧美一级www片免费观看 | 亚洲国产成人久久99精品 | 国产美女流出白浆在线观看 | 色内内免费视频播放 | 特级全黄大片 | 久久综合综合久久 | 很黄很暴力 很污秽的小说 很黄很黄叫声床戏免费视频 | 一级毛片免费在线观看网站 | 好黄好猛好爽好痛的视频 | 欧美性色xo影院永久禁欲 | a黄网站 | 特一级毛片| 在线看片福利 | 天天碰夜夜 | 久久久久久国产精品免费免 | 久久人视频 | 色女人久久 | 日本三级欧美三级香港黄 | 免费a级午夜绝情美女视频 免费jlzzjlzz在线播放视频 | 免费观看一级特黄欧美大片 | 7777色鬼xxxx欧美色夫 |