在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

算力網絡的“神經突觸”:AI互聯技術如何重構分布式訓練范式

Carol Li ? 來源:電子發燒友網 ? 作者:電子發燒友 ? 2025-06-08 08:11 ? 次閱讀

電子發燒友網綜合報道 隨著AI技術迅猛發展,尤其是大型語言模型的興起,對于算力的需求呈現出爆炸性增長。這不僅推動了智算中心的建設,還對網絡互聯技術提出了新的挑戰。

AI大模型訓練過程中,由于單個AI芯片的算力提升速度無法跟上模型參數的增長速率,再加上龐大的模型參數和訓練數據,已遠遠超出單個AI芯片甚至單臺服務器的能力范圍。因此,需要將數據樣本和模型結構分散到多個計算設備上,這導致了設備間的頻繁通信需求。為了適應這一變化,智算中心服務器內部的網絡互聯技術變得至關重要。

芯片間互聯技術

AI服務器的互聯技術是保障其高性能計算能力的關鍵,涉及芯片間、服務器內以及服務器間等多個層面的高速數據傳輸。

芯片間互聯技術方面,英偉達AMD英特爾都推出了相關技術,分別是NVLink、Infinity Fabric、CXL(Compute Express Link)等。NVLink是由NVIDIA開發的GPU之間的高速互連技術,能加快CPU與GPU、GPU與GPU之間的數據傳輸速度,提高系統性能。從2016年到2022年,NVLink歷經多次迭代更新,例如基于Hopper架構的第四代NVLink,單鏈可實現50GB/s的雙向帶寬,單芯片可支持18鏈路,即900GB/s的總雙向帶寬。在NVIDIA的DGX H100服務器中,GPU(H100)之間互聯主要通過NV Switch芯片來實現,而NV Switch芯片與GPU之間的數據傳輸就依賴于NVLink。

AMD推出的Infinity Fabric,由傳輸數據的Infinity Scalable Data Fabric(SDF)和負責控制的Infinity Scalable Control Fabric(SCF)兩個系統組成,連接了on-die和off-die以及多路CPU間的通信。最新的AMD Instinct MI300X GPU采用5nm制程,支持客戶將8個GPU整合為一個性能主導型節點,并且具有全互聯式點對點環形設計,使用了第4代Infinity Fabric高速總線互聯,總線帶寬達到896GB/s(與英偉達H100的900GB/s帶寬相當)。

CXL(Compute Express Link)是英特爾提出的一種開放性互聯協議,CXL是建立在PCIe物理層之上的協議,可以實現設備之間的緩存和內存一致性。利用廣泛存在的PCIe接口,CXL允許內存在各種硬件上共享:CPU、NIC和DPU、GPU和其它加速器、SSD和內存設備,從而滿足高性能異構計算的要求。

服務器內互聯技術有PCIe Switch、Retimer芯片。PCIe Switch,即PCIe開關或PCIe交換機,主要作用是實現PCIe設備互聯。由于PCIe的鏈路通信是一種端對端的數據傳輸,需要Switch提供擴展或聚合能力,從而允許更多的設備連接到一個PCIe端口,以解決PCIe通道數量不夠的問題。例如在AI服務器中,GPU與CPU連接時可能需要用到PCIe Switch,并且隨著PCIe總線技術的升級,PCIe Switch每代速率提升,能提高數據傳輸的速度。

在AI服務器中,GPU與CPU連接時至少需要一顆Retimer芯片來保證信號質量,很多AI服務器都會配置多顆Retimer芯片。例如Astera Labs在AI加速器中配置了4顆Retimer芯片。

AI服務器間互聯技術

服務器間互聯技術有InfiniBand、RoCE、高速以太網。InfiniBand是一種高性能的網絡互聯技術,具有低延遲、高帶寬的特點,能夠滿足AI服務器之間超低延遲、超高帶寬的通信需求,適用于大規模AI模型訓練時服務器之間的高效通信和數據同步。例如訓練超大模型往往需要成百上千臺服務器組成集群,服務器之間就需要InfiniBand這樣的網絡進行高效通信。

RoCE(RDMA over Converged Ethernet),基于以太網的RDMA(遠程直接內存訪問)技術,它允許數據在網絡中直接從一臺計算機的內存傳輸到另一臺計算機的內存,而無需操作系統內核的介入,從而降低了延遲,提高了帶寬利用率,可用于AI服務器間的互聯,提升數據傳輸效率。

高速以太網,如400Gbps甚至800Gbps以太網適配器,能為AI服務器間提供高速的網絡連接,保障大規模集群部署時服務器之間的數據傳輸性能。例如昆侖芯超節點結合百度智能云自研的基于導軌優化的HPN(High Performance Network)架構,可支撐從數百卡到上萬卡的XPU集群構建,其中就涉及到高速以太網技術的應用。

小結

在AI服務器中,互聯技術的作用已從數據傳輸通道升級為算力釋放引擎。通過高帶寬、低延遲、可擴展的互聯架構,AI服務器能夠突破單節點算力瓶頸,實現萬億參數模型的分布式訓練;降低推理延遲,支撐實時AI應用的商業化落地;優化能效比,應對超大規模數據中心的能耗挑戰。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34405

    瀏覽量

    275679
  • 算力
    +關注

    關注

    2

    文章

    1153

    瀏覽量

    15476
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    潤和軟件發布StackRUNS異構分布式推理框架

    當下,AI模型規模持續膨脹、多模態應用場景日益復雜,企業正面臨異構資源碎片化帶來的嚴峻挑戰。為應對行業痛點,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發布自主研發的StackRUNS異構
    的頭像 發表于 06-13 09:10 ?179次閱讀
    潤和軟件發布StackRUNS異構<b class='flag-5'>分布式</b>推理框架

    華為AI WAN智IP廣域網助力互聯網建設

    的發展機遇。數據通信網絡的高效性、可靠性和智能化程度,直接決定了資源能否在廣域網范圍內實現快速、精準的調配與利用,進而影響
    的頭像 發表于 06-11 11:21 ?278次閱讀

    上海電信攜手華為打造分布式云邊協同訓推方案

    Deepseek加速行業推理應用,面向企業租用以及推理數據不出園區的用需求,上海電信基于“智云上海”新型基礎架構,部署華為星河路由器打造400GE IP智城域POD,提供
    的頭像 發表于 05-19 11:20 ?306次閱讀

    AI原生架構升級:RAKsmart服務器在超大規模模型訓練中的突破

    近年來,隨著千億級參數模型的崛起,AI訓練的需求呈現指數級增長。傳統服務器架構在應對分布式訓練
    的頭像 發表于 04-24 09:27 ?211次閱讀

    RAKsmart智能架構:異構計算+低時延網絡驅動企業AI訓練范式升級

    AI大模型參數量突破萬億、多模態應用爆發的今天,企業AI訓練正面臨效率與成本的雙重挑戰。RAKsmart推出的智能
    的頭像 發表于 04-17 09:29 ?255次閱讀

    適用于數據中心和AI時代的800G網絡

    和性能隔離能力,以保障不同用戶任務互不干擾。 分布式AI計算與網絡架構設計 分布式計算已成為AI
    發表于 03-25 17:35

    DeepSeek推動AI需求:800G光模塊的關鍵作用

    隨著人工智能技術的飛速發展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務對
    發表于 03-25 12:00

    信而泰CCL仿真:解鎖AI極限,智中心網絡性能躍升之道

    中心RoCE網絡提供精準評估方案,助力企業突破瓶頸,釋放AI澎湃動力! 什么是智中心 智
    的頭像 發表于 02-24 17:34 ?394次閱讀
    信而泰CCL仿真:解鎖<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>極限,智<b class='flag-5'>算</b>中心<b class='flag-5'>網絡</b>性能躍升之道

    芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    線程調度,與Hopper架構的細粒度同步機制,使得異構計算場景下的任務協同更加靈活。在我的分布式訓練實踐中,這些特性顯著提升了模型收斂速度。 張量處理器的設計是本書點睛之筆。從數學抽象來看,張量統一了
    發表于 11-24 17:12

    分布式通信的原理和實現高效分布式通信背后的技術NVLink的演進

    大型模型的大小已經超出了單個 GPU 的范圍。所以就需要實現跨多個 GPU 的模型訓練,這種訓練方式就涉及到了分布式通信和 NVLink。 當談及分布式通信和 NVLink 時,我們進
    的頭像 發表于 11-18 09:39 ?1165次閱讀
    <b class='flag-5'>分布式</b>通信的原理和實現高效<b class='flag-5'>分布式</b>通信背后的<b class='flag-5'>技術</b>NVLink的演進

    企業AI租賃是什么

    企業AI租賃是指企業通過互聯網向專業的提供商租用所需的計算資源,以滿足其
    的頭像 發表于 11-14 09:30 ?2342次閱讀

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    訓練和推理提供了強大的支持,使得AI在科學研究中的應用更加廣泛和深入。 3. 數據驅動的研究范式 第二章還強調了數據在
    發表于 10-14 09:16

    AI網絡物理層底座: 大芯片先進封裝技術

    隨著人工智能(AI技術的迅猛發展,我們正站在第四次工業革命的風暴中, 這場風暴也將席卷我們整個芯片行業,特別是先進封裝領域。Chiplet是實現單個芯片提升的重要
    發表于 09-11 09:47 ?1211次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>網絡</b>物理層底座: 大<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片先進封裝<b class='flag-5'>技術</b>

    怎么對神經網絡重新訓練

    重新訓練神經網絡是一個復雜的過程,涉及到多個步驟和考慮因素。 引言 神經網絡是一種強大的機器學習模型,廣泛應用于圖像識別、自然語言處理、語音識別等領域。然而,隨著時間的推移,數據分布
    的頭像 發表于 07-11 10:25 ?797次閱讀

    如何訓練和優化神經網絡

    神經網絡是人工智能領域的重要分支,廣泛應用于圖像識別、自然語言處理、語音識別等多個領域。然而,要使神經網絡在實際應用中取得良好效果,必須進行有效的訓練和優化。本文將從神經網絡
    的頭像 發表于 07-01 14:14 ?918次閱讀
    主站蜘蛛池模板: 最新eeuss影院第256页 | 巨乳色网站 | 免费的黄色毛片 | 亚洲午夜视频 | 国语自产自拍秒拍在线视频 | 国产片一区二区三区 | 久久伊人成人网 | 男人操女人视频网站 | 午夜女同影院 | 亚洲精品在线视频观看 | 成人在线视频网址 | 毛片高清一区二区三区 | 国模大胆一区二区三区 | 欧美午夜精品 | 四虎新地址4hu 你懂的 | 欧美黄色大片免费观看 | 大色综合 | 男人的天堂免费视频 | 免费恐怖片 | 久久人人视频 | 伊人网色| 岛国午夜| 亚洲视频一 | 色爱综合区五月小说 | 欧洲性开放大片免费观看视频 | 情久久 | 欧美18同性gay视频 | 污污的网站免费阅读 | 一级片免费观看视频 | 午夜噜噜噜私人影院在线播放 | 天天色影综合网 | 四虎永久在线精品 | 一级毛片免费全部播放完整 | 黄色字幕网 | 两性午夜欧美高清做性 | 亚洲区视频在线观看 | 伊人久久影院大香线蕉 | 国产精品福利午夜在线观看 | 四虎精品免费永久在线 | 干干操 | 看片福利|