91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

重新思考 AI 時代的分布式計算

穎脈Imgtec ? 2025-07-31 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepSeek的崛起,不僅因其巨大成就,更因其高效性而在AI行業引起了震動。雖然大家的關注重點大都放在DeepSeek僅花費了560萬美元的訓練成本,而OpenAI花費超過1億美元,但其中更深層次的關注點在于這一效率突破揭示了傳統分布式計算范式與AI工作負載獨特需求之間的根本不匹配。

AI技術浪潮對基礎設施選型帶來了深層挑戰:當前廣泛部署的分布式計算架構本質上仍是為解決20世紀的大規模數據處理問題而設計,卻承擔著運行21世紀AI工作負載的重任。DeepSeek的突破性實踐揭示了一個關鍵命題——業界需要從根本上重新思考如何實現AI的分布式計算,其影響將遠遠超出訓練成本的范疇。


分布式計算與AI發展不匹配

傳統的分布式計算是基于一些假設而設計的,而這些假設在人工智能時代已不復存在。不妨想想經典的 MapReduce 范式,它徹底改變了大數據處理:它擅長處理高度并行的問題,即數據可以清晰地分區,并且計算在很大程度上是獨立的。然而,Transformer 架構展現出了截然不同的計算模式。

Transformer 訓練在注意力計算過程中涉及密集的、all-to-all的通信模式。每個 token 都可能關注其他所有 token,從而產生隨序列長度平方增長的通信需求。這與傳統分布式系統處理良好的稀疏、分層通信模式截然相反。注意力機制的全局依賴性意味著,在傳統分布式工作負載中行之有效的“分而治之”策略在AI中變得適得其反。

再看內存訪問模式,問題更為嚴重。傳統的分布式計算假設計算可以與數據共存,從而最大限度地減少網絡流量——這是自集群計算早期以來一直指導系統設計的原則。但Transformer 架構需要在海量參數空間(有時甚至高達數千億個參數)中頻繁同步梯度更新。由此產生的通信開銷可能會占據總訓練時間的大部分,這也解釋了為什么增加更多 GPU 往往會帶來的收益遞減,而非設計良好的分布式系統所預期的線性擴展。


DeepSeek 效率革命的經驗教訓

DeepSeek 的成就不僅在于其巧妙的算法,更在于其架構選擇能夠更好地契合 AI 工作負載的特性。其混合專家 (MoE) 方法通過使計算再次稀疏化,從根本上改變了分布式計算方程。MoE 架構并非要求每個 GPU 都處理所有參數,而是在每次計算中僅激活模型的子集,從而顯著降低了通信需求。

更有趣的是,DeepSeek 強調“蒸餾”和強化學習,而非傳統的監督微調,這表明它正在轉向更高效的通信訓練范式。與監督學習相比,基于獎勵的強化學習可以比需要跨所有節點緊密同步標記訓練數據的監督學習更自然地分布。但更深層次的教訓并非關于具體的技術,而是關于如何將AI工作負載與分布式系統協同設計,而不是強迫AI工作負載適應現有的分布式計算模式。這代表著我們需要從根本上對分布式系統設計思維方式進行轉變。


重新思考分布式人工智能系統:三個核心原則

如果從頭開始為AI工作負載設計分布式計算,會是什么樣子?總的來說可以歸納為以下三個原則:

1. 異步優先設計:傳統參數服務器假設同步更新以保持一致性,這一原則借鑒自數據庫系統,在數據庫系統中,正確性至關重要。但AI訓練本身對某些不一致性具有魯棒性;即使梯度過時,模型也能收斂。采用有限異步可以顯著降低通信開銷,同時保持訓練效率。這不僅僅關乎最終一致性,而是設計能夠容忍并從受控不一致性中受益的系統。

2. 分層通信模式:AI 原生的分布式系統應該利用 Transformer 架構中自然的層級結構,而非扁平的all-to-all通信。層內注意力模式與跨層依賴關系不同,這為多層通信優化提供了機會。我們需要能夠理解這些計算依賴關系并相應地優化通信的分布式系統。

3. 自適應資源分配:與資源需求可預測的傳統工作負載不同,AI 訓練表現出階段依賴性行為。早期訓練側重于學習基本模式,對通信精度的要求低于后期的微調階段。分布式系統應該在整個訓練過程中調整其通信策略和資源分配,而不是將其視為靜態工作負載。


基礎設施投資悖論

業界目前應對 AI 擴展挑戰的措施,例如 Stargate 宣布的 5000 億美元基礎設施投資,基本上都遵循著“大同小異”的策略:更大的 GPU 集群、更快的互連速度、更高的內存帶寬。雖然有必要,但這種策略治標不治本,就像在高速公路上增加車道,卻不解決交通信號燈的配時問題。

如果目前的趨勢持續下去,AI訓練可能會在幾十年內消耗掉全球相當一部分電力。但能源消耗不僅僅取決于操作次數,它很大程度上受到數據移動的影響。在對節能分布式系統的研究過程中可以觀察到,數據移動通常比計算本身消耗的能量高出幾個數量級。更好的分布式計算架構可以最大限度地減少不必要的通信,從而實現大量的能源節約,使AI的發展更具可持續性。


跨層優化:尚未開發的前沿

最有前景的方法涉及跨層優化,而傳統系統在維護抽象邊界時會避免使用這種優化。例如,現代 GPU 支持混合精度計算,但分布式系統很少能夠智能地利用這一能力。梯度更新可能不需要與前向傳播相同的精度,這意味著精度感知通信協議有機會將帶寬需求降低 50% 或更多。

同樣,從谷歌的TPU到新興的神經形態芯片,AI專用硬件的興起也帶來了新的分布式計算挑戰。這些架構通常具有不統一的內存層次結構和專用互連,無法清晰地映射到傳統的分布式計算抽象上。我們需要新的分布式系統設計,能夠利用這些硬件特定的優化,同時保持可移植性。

31a4497c-6dd7-11f0-9080-92fbcf53809c.png

從傳統的基于網格的分布式計算架構(左)到AI原生的流暢互連系統設計(右)的演變。可視化顯示幾何節點從僵化的層級模式演變為針對AI工作負載通信模式優化的自適應、密集連接的類神經架構。


展望:后 GPU 時代

或許最重要的是,我們目前以 GPU 為中心的 AI 基礎設施觀念可能只是暫時的。隨著我們越來越接近摩爾定律和登納德縮放定律的極限,未來很可能屬于專用的異構計算架構。量子-經典混合系統、神經形態處理器光學計算平臺將需要全新的分布式計算范式。

在這個過渡中成功的組織將不是那些擁有最多GPU的組織,而是那些最理解如何為AI工作負載編排復雜的、異構的分布式系統的組織。DeepSeek的效率突破只是一個開始,它表明,架構創新并非僅僅是原始計算能力,仍然是AI進步的關鍵。

隨著AI行業日趨成熟,超越了當前“投入更多計算”的階段,分布式系統的基本原則——一致性、可用性、分區容錯性和效率,將決定哪些方法能夠持續發展。未來的道路需要我們摒棄對傳統分布式計算模式的執著,擁抱專為 AI 工作負載優化的設計。這不僅僅是一個優化問題,更是對如何為 AI 優先的世界構建分布式系統的根本性反思。

*本文轉自SDNLAB,編譯自 CACM Blog,作者:Akshay Mittal。

原文鏈接:https://cacm.acm.org/blogcacm/rethinking-distributed-computing-for-the-ai-era/


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35476

    瀏覽量

    281205
  • DeepSeek
    +關注

    關注

    2

    文章

    804

    瀏覽量

    1821
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    訊維AI分布式控制系統的核心優勢和應用場景

    在數字化轉型的浪潮中,音視頻技術正從傳統的信號傳輸工具進化為智能交互的核心載體。訊維AI分布式可視化控制系統通過深度融合AI技術與分布式架構,構建了"去中心化節點+
    的頭像 發表于 05-26 15:12 ?543次閱讀

    訊維AI分布式系統的十大優勢

    在數字化轉型浪潮中,音視頻技術正從傳統的信號傳輸工具演變為智能交互的核心載體。訊維AI分布式系統通過與AI技術的深度融合,構建了"去中心化架構+AI智能引擎"的創新體系,實現了音視頻信
    的頭像 發表于 04-15 14:53 ?607次閱讀

    使用VirtualLab Fusion中分布式計算的AR波導測試圖像模擬

    計算時間超過31小時。通過使用一個由8個多核PC組成的網絡,提供35個客戶端分布式計算,將模擬時間減少到1小時5分鐘。基本模擬任務基本任務集合:FOV使用分布式
    發表于 04-10 08:48

    適用于數據中心和AI時代的800G網絡

    和性能隔離能力,以保障不同用戶任務互不干擾。 分布式AI計算與網絡架構設計 分布式計算已成為A
    發表于 03-25 17:35

    VirtualLab Fusion應用:基于分布式計算的AR光波導中測試圖像的仿真

    (10201次模擬):大約43小時。 模擬結果:不同視場角的輻射通量*。 *注: 21個×21個方向的結果存儲在參數連續變化的光柵的查找表中。 使用分布式計算 參數運行用于改變當前視場模式的角度,這
    發表于 02-19 08:51

    分布式云化數據庫有哪些類型

    分布式云化數據庫有哪些類型?分布式云化數據庫主要類型包括:關系型分布式數據庫、非關系型分布式數據庫、新SQL分布式數據庫、以列方式存儲數據、
    的頭像 發表于 01-15 09:43 ?520次閱讀

    基于ptp的分布式系統設計

    在現代分布式系統中,精確的時間同步對于確保數據一致性、系統穩定性和性能至關重要。PTP(Precision Time Protocol)是一種網絡協議,用于在分布式系統中實現高精度的時間同步
    的頭像 發表于 12-29 10:09 ?607次閱讀

    HarmonyOS Next 應用元服務開發-分布式數據對象遷移數據權限與基礎數據

    使用分布式數據對象遷移數據,當需要遷移的數據較大(100KB以上)或需要遷移文件時,可以使用分布式數據對象。原理與接口說明詳見分布式數據對象跨設備數據同步。 說明:自API 12起,由于直接使用跨
    發表于 12-24 09:40

    星融元與焱融科技AI分布式存儲軟硬件完成兼容性互認證

    星融元與焱融科技AI分布式存儲軟硬件完成兼容性互認證
    的頭像 發表于 11-20 16:36 ?604次閱讀
    星融元與焱融科技<b class='flag-5'>AI</b><b class='flag-5'>分布式</b>存儲軟硬件完成兼容性互認證

    訊維AI分布式無紙化交互系統:突破傳統,引領AI智能會商新革命!

    及快速部署能力上還存在巨大的短板。訊維分布式無紙化交互系統以其快速的系統部署能力、強大的數據互通能力、創新的AI智能交互能力的特點,實現了音視頻會議系統的又一次創新變革,從此音視頻會議系統迎來了AI智能會商
    的頭像 發表于 11-18 16:53 ?754次閱讀
    訊維<b class='flag-5'>AI</b><b class='flag-5'>分布式</b>無紙化交互系統:突破傳統,引領<b class='flag-5'>AI</b>智能會商新革命!

    分布式通信的原理和實現高效分布式通信背后的技術NVLink的演進

    大型模型的大小已經超出了單個 GPU 的范圍。所以就需要實現跨多個 GPU 的模型訓練,這種訓練方式就涉及到了分布式通信和 NVLink。 當談及分布式通信和 NVLink 時,我們進入了一個引人入勝且不斷演進的技術領域,下面我們將簡單介紹
    的頭像 發表于 11-18 09:39 ?1378次閱讀
    <b class='flag-5'>分布式</b>通信的原理和實現高效<b class='flag-5'>分布式</b>通信背后的技術NVLink的演進

    分布式光纖測溫解決方案

    分布式光纖測溫解決方案
    的頭像 發表于 11-12 01:02 ?596次閱讀
    <b class='flag-5'>分布式</b>光纖測溫解決方案

    分布式光纖測溫是什么?應用領域是?

    分布式光纖測溫是一種先進的溫度測量技術,它利用光纖的拉曼散射原理進行溫度監測。以下是對分布式光纖測溫的詳細介紹: 一、基本原理 分布式光纖測溫的原理基于光纖的拉曼散射效應。當光纖某處的溫度發生變化
    的頭像 發表于 10-24 15:30 ?1344次閱讀
    <b class='flag-5'>分布式</b>光纖測溫是什么?應用領域是?

    【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受

    再到大模型云平臺的構建,此書都有提及和講解,循序漸進,讓讀者可以由點及面,由面到體的來認識大數據模型的體系架構。 前言中,作者通過提出幾個問題來引導讀者閱讀思考——分布式AI計算依賴哪
    發表于 10-08 10:40

    基于分布式計算的AR光波導中測試圖像的仿真

    (10201次模擬):大約43小時。 模擬結果:不同視場角的輻射通量。 注: 21個×21個方向的結果存儲在參數連續變化的光柵的查找表中。 使用分布式計算 參數運行用于改變當前視場模式的角度,這允許將
    發表于 08-07 14:13
    主站蜘蛛池模板: 国产成人精品高清在线 | 你懂的在线观看网站 | 特黄特色大片免费视频大全 | 天天综合天天射 | 一级特黄特黄的大片免费 | 激情九月 | 成人性欧美丨区二区三区 | 国内精品久久久久影院薰衣草 | 明日花绮罗在线观看 | 91久久婷婷国产综合精品青草 | 国产精品三级在线 | 亚洲免费色视频 | 欧美视频一区二区三区四区 | 欧美日本俄罗斯一级毛片 | 扒开双腿猛进入jk校视频 | 国产精品一区二区三 | 天天操夜夜操 | 亚洲插 | 视频网站免费看 | 色爱区综合激情五月综合色 | 国产区亚洲区 | 久久久免费视频观看 | 色综合888 | 日本黄色生活片 | 3344在线观看永久免费 | 综合精品视频 | 女人张开腿等男人桶免费视频 | 日韩基地1024首页 | 天天性综合| 特级aaa片毛片免费观看 | 天天做天天玩天天爽天天 | 日本wwww色| 欧美高清xx| 国内黄色一级片 | 国产精品资源在线 | 色中射 | 又粗又大又爽又色又过瘾视频 | 四虎国产精品永久在线看 | 国产成人在线播放视频 | 国产成人午夜片在线观看 | 成人a毛片在线看免费全部播放 |