在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為云黃瑾:昇騰云CloudMatrix 384超節(jié)點(diǎn)六大科技創(chuàng)新,定義下一代AI基礎(chǔ)設(shè)施

jf_21561199 ? 來源:jf_21561199 ? 2025-05-17 10:31 ? 次閱讀

近日,華為云 AI 峰會在北京召開,華為云副總裁黃瑾發(fā)表主題演講,介紹了更多 CloudMatrix 384超節(jié)點(diǎn)技術(shù)優(yōu)勢與細(xì)節(jié)。他指出,隨著大模型訓(xùn)練和推理對算力需求的爆炸式增長,傳統(tǒng)計(jì)算架構(gòu)已難以支撐 AI 技術(shù)的代際躍遷,超節(jié)點(diǎn)架構(gòu)的誕生不僅是技術(shù)的突破,更是以工程化創(chuàng)新開辟 AI 產(chǎn)業(yè)的新路徑。華為云 CloudMatrix 384 超節(jié)點(diǎn)具備 MoE 親和、以網(wǎng)強(qiáng)算、以存強(qiáng)算、長穩(wěn)可靠、朝推夜訓(xùn)、即開即用六大領(lǐng)先技術(shù)優(yōu)勢,以系統(tǒng)架構(gòu)創(chuàng)新重新定義新一代 AI 基礎(chǔ)設(shè)施。

重新定義 AI 基礎(chǔ)設(shè)施架構(gòu),開辟算力新紀(jì)元

當(dāng)前,大模型訓(xùn)練從早期小模型在單卡訓(xùn)練、小參數(shù)大模型在單機(jī)訓(xùn)練,現(xiàn)在 MoE、長序列、多模態(tài)大模型都是在 AI 集群上訓(xùn)練,AI 算力的瓶頸,從到單卡算力的瓶頸到單機(jī)內(nèi)總線帶寬的瓶頸,到現(xiàn)在集群間通信帶寬的瓶頸,需求增長了 1 萬倍。

然而過去的 8 年里,單卡硬件的算力增長了 40 倍,但是節(jié)點(diǎn)內(nèi)的總線帶寬只增長了 9 倍,跨節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬只增長了 4 倍,這使得集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn)。

黃瑾表示,面對這些挑戰(zhàn),華為云創(chuàng)新性的推出采用全對等互聯(lián)架構(gòu)的 CloudMatrix 384 超節(jié)點(diǎn)。這項(xiàng)技術(shù)創(chuàng)新跳出單點(diǎn)技術(shù)限制走向系統(tǒng)性、工程性的創(chuàng)新算力架構(gòu)直面通信效率瓶頸、內(nèi)存墻制約、可靠性短板三大技術(shù)挑戰(zhàn)。通過新型高速互聯(lián)總線實(shí)現(xiàn) 384 張卡互聯(lián)成為一個(gè)超級云服務(wù)器,最高提供 300Pflops 的算力規(guī)模,比業(yè)界同類產(chǎn)品領(lǐng)先 67%。

解碼六大優(yōu)勢,CloudMatrix 384 超節(jié)點(diǎn)重構(gòu) AI 算力架構(gòu)

目前,基于 CloudMatrix 的超節(jié)點(diǎn)集群已經(jīng)在蕪湖、貴安、內(nèi)蒙規(guī)模上線,黃瑾進(jìn)一步深入解讀了六大技術(shù)創(chuàng)新點(diǎn):

MoE 親和架構(gòu),從“小作坊”到“超級工廠”。在傳統(tǒng)架構(gòu)下,MoE 模型訓(xùn)練容易因通信延遲導(dǎo)致算力浪費(fèi),而 CloudMatrix 384 超節(jié)點(diǎn)的分布式推理平臺可以說是專為 MoE 大模型而生。黃瑾指出,對比一卡多專家的“小作坊模式”,超節(jié)點(diǎn)更像“大工廠模式”,通過高速互聯(lián)總線,能夠?qū)崿F(xiàn)一卡一專家高效分布式推理,單卡的 MoE 計(jì)算和通信效率都大幅提升。這也是為什么有幾百個(gè)政務(wù)、零售、醫(yī)療、保險(xiǎn)、制造、礦山、旅游等各行各業(yè)的客戶,基于華為云昇騰 AI 云服務(wù)部署 DeepSeek 模型的創(chuàng)新應(yīng)用,例如智能助手、智能客服、互聯(lián)網(wǎng)搜索、內(nèi)容創(chuàng)作等各種場景落地。

以網(wǎng)強(qiáng)算,雙層網(wǎng)絡(luò)破解“數(shù)據(jù)堵車”。當(dāng)AI 算力走向規(guī)模化部署,單點(diǎn)的芯片性能不再是制約算力發(fā)展的唯一變量,如何由點(diǎn)及面地激活算力矩陣的共振效應(yīng),也是破解 AI 時(shí)代算力命題的關(guān)鍵一步。而釋放聯(lián)接力也正是超節(jié)點(diǎn)最大的創(chuàng)新突破之一,黃瑾介紹,傳統(tǒng)網(wǎng)絡(luò)像擁堵的城市道路,CloudMatrix 384 則構(gòu)建了 AI 專屬高架橋,通過 MatrixLink 服務(wù)將單層網(wǎng)絡(luò)升級為兩層高速網(wǎng)絡(luò),一層是超節(jié)點(diǎn)內(nèi)部的 ScaleUp 總線網(wǎng)絡(luò),確保超節(jié)點(diǎn)內(nèi) 384 卡全對等高速無阻塞互聯(lián),卡間超大帶寬 2.8T,納秒級時(shí)延;另一層是跨超節(jié)點(diǎn)間的 ScaleOut 網(wǎng)絡(luò),可支持微秒級時(shí)延,資源彈性擴(kuò)展;同時(shí),基于全局拓?fù)涓兄闹悄苷{(diào)度算法,保障客戶任務(wù)長穩(wěn)運(yùn)行。

以存強(qiáng)算,彈性內(nèi)存改寫“算存綁定”。華為云首創(chuàng)了 EMS 彈性內(nèi)存存儲,打破傳統(tǒng) GPU 算力與顯存綁定的關(guān)鍵障礙,通過內(nèi)存池化技術(shù),實(shí)現(xiàn)顯存和算力解綁。一方面,用 EMS 替代 NPU 中的顯存,可使得首 Token 時(shí)延降低,最高降幅可達(dá) 80%;另一方面,當(dāng) NPU 的顯存不足時(shí),EMS 獨(dú)立擴(kuò)容,不必再通過堆 NPU 以獲得更多內(nèi)存。同時(shí),EMS 還支持算力卸載,這也使得系統(tǒng)吞吐量提升,有的場景達(dá) 100%的提升。總之,這一技術(shù)創(chuàng)新大幅提升了資源利用率、性能和吞吐量。

長穩(wěn)可靠,故障自愈的“AI 醫(yī)生”。隨著模型訓(xùn)練需求的不斷接入,大集群的運(yùn)維難度大、復(fù)雜性高的問題日益凸顯。對此,華為云開發(fā)了昇騰云腦運(yùn)維“1-3-10”標(biāo)準(zhǔn),即 1 分鐘感知、3 分鐘定界、10 分鐘內(nèi)恢復(fù)。通過 5 層壓測、靜默故障感知技術(shù),昇騰云腦可將硬件故障感知率從 40%提升至 90%。同時(shí),覆蓋計(jì)算、存儲、網(wǎng)絡(luò)、軟件四大種類故障模式庫也打通了全棧故障場景,這一全棧故障知識庫能夠覆蓋 95%常見問題以實(shí)現(xiàn)故障快速定界;在恢復(fù)機(jī)制上則,3 層快恢技術(shù)、快速建鏈技術(shù)、圖編譯緩存等技術(shù)能夠?qū)崿F(xiàn)萬卡故障快速恢復(fù)。

朝推夜訓(xùn),算力資源“錯(cuò)峰用電”。在大模型訓(xùn)練中,提升算力利用率,避免算力閑置也是企業(yè)關(guān)心的重點(diǎn)之一。CloudMatrix384 超節(jié)點(diǎn)通過“訓(xùn)推共池”“靈活調(diào)度”兩大關(guān)鍵技術(shù)實(shí)現(xiàn)朝推夜訓(xùn),白天進(jìn)行模型推理,晚上閑時(shí)進(jìn)行模型訓(xùn)練,算力資源利用率可提升 30%以上。

即開即用,“算力水電”普惠模式。為助力客戶更好地專注業(yè)務(wù)模型開發(fā),華為云已經(jīng)在全國三大樞紐數(shù)據(jù)中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點(diǎn)規(guī)模布局,支持百 TB 級的帶寬互聯(lián),10 毫秒時(shí)延圈覆蓋全國 19 個(gè)城市群,讓客戶能夠第一時(shí)間享受到即開即用的 AI 算力資源。同時(shí),華為云擁有專業(yè)的超節(jié)點(diǎn)運(yùn)維團(tuán)隊(duì),在為客戶免去繁瑣的管理和維護(hù)的同時(shí),保障資源的穩(wěn)定運(yùn)行。

做好智能世界云底座和使能器,加速行業(yè)智能躍遷

如今 AI 已經(jīng)成為最有影響力的通用技術(shù),如何將技術(shù)價(jià)值轉(zhuǎn)化為應(yīng)用成果,成為千行百業(yè)面臨的核心課題。華為云超節(jié)點(diǎn)創(chuàng)新系統(tǒng)架構(gòu)的背后,是華為云堅(jiān)持“昇騰云服務(wù)支持百模千態(tài),盤古大模型重塑千行萬業(yè)”的戰(zhàn)略。

黃瑾強(qiáng)調(diào),一直以來華為云持續(xù)推動昇騰 AI 云服務(wù)全面升級,通過打磨昇騰云的訓(xùn)練、推理的性能、可靠性和性價(jià)比,為中國乃至全球客戶提供好用、易用的 AI 算力云服務(wù)。現(xiàn)已全面適配了 DeepSeek 在內(nèi)的 160 多個(gè)大模型,以云服務(wù)的方式,協(xié)助客戶進(jìn)行模型的開發(fā),訓(xùn)練,托管和應(yīng)用。昇騰 AI 云服務(wù)上線以來,面向政府、金融、零售、互聯(lián)網(wǎng)、交通、制造等行業(yè)已經(jīng)服務(wù)六百多家創(chuàng)新先鋒企業(yè),加速行業(yè)智能化應(yīng)用的快速落地。

在充滿突破和創(chuàng)新的 AI 發(fā)展過程中,每一個(gè)階段都會產(chǎn)生大量的新技術(shù)、新模式,企業(yè)唯有抓住 AI 時(shí)代機(jī)遇,才能搶占發(fā)展先機(jī)。黃瑾表示,面向智能世界,華為云致力于做好行業(yè)數(shù)字化的“云底座”和“使能器”,堅(jiān)定打造 AI 算力底座,以安全、穩(wěn)定、高質(zhì)量、持續(xù)創(chuàng)新的 AI 云服務(wù),賦能千行萬業(yè)應(yīng)用創(chuàng)新,攜手伙伴、客戶加速行業(yè)智能躍遷。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7963

    瀏覽量

    139214
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33885

    瀏覽量

    274786
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2759

    瀏覽量

    18070
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為節(jié)點(diǎn)創(chuàng)新算力基礎(chǔ)設(shè)施,推動千行萬業(yè)AI應(yīng)用開發(fā)落地

    近日,“逐光向新·智領(lǐng)未來”華為 AI 峰會于北京成功舉辦。大會期間,華為面向客戶伙伴詳細(xì)介紹了 CloudMartix
    的頭像 發(fā)表于 05-17 10:30 ?257次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展

    近日,華為公司常務(wù)董事、華為計(jì)算CEO張平安在華為生態(tài)大會2025上公布了AI
    的頭像 發(fā)表于 04-12 15:09 ?690次閱讀

    軟通動力攜手伙伴發(fā)布六大聯(lián)合解決方案

    ToB運(yùn)營解決方案”、 “天慧智園解決方案”六大聯(lián)合解決方案,其中多個(gè)方案深度融入AI能力,旨在為高校、園區(qū)、運(yùn)營商、醫(yī)療等關(guān)鍵行業(yè)領(lǐng)域的數(shù)智化轉(zhuǎn)型注入強(qiáng)勁動力。 1 騰DeepS
    的頭像 發(fā)表于 03-22 10:30 ?778次閱讀
    軟通動力攜手伙伴發(fā)布<b class='flag-5'>六大</b>聯(lián)合解決方案

    從虛擬化到AI基礎(chǔ)設(shè)施:Gartner定義下一代融合的“全棧”路徑

    近日,權(quán)威市場分析機(jī)構(gòu) Gartner 發(fā)布《2025 中國區(qū)融合市場競爭格局報(bào)告》,對中國融合市場的發(fā)展趨勢和主流廠商進(jìn)行了深入解析。報(bào)告認(rèn)為,中國融合市場已經(jīng)達(dá)到了主流采用階段,
    的頭像 發(fā)表于 03-19 14:15 ?393次閱讀

    華為打造移動AI時(shí)代領(lǐng)先電信基礎(chǔ)設(shè)施

    使能平臺,助力運(yùn)營商電信基礎(chǔ)設(shè)施從架構(gòu)、自動化、綠色、AI等方面全面升級,從容應(yīng)對復(fù)雜網(wǎng)絡(luò)挑戰(zhàn),使能AI業(yè)務(wù)創(chuàng)新,打造移動AI時(shí)代領(lǐng)先電信
    的頭像 發(fā)表于 03-08 11:39 ?624次閱讀

    湖南 DeepSeek+騰云技術(shù)應(yīng)用沙龍成功舉辦,拓維信息助力 AI 新范式探索

    近日,以“智共生·湘見未來”為主題的“湖南DeepSeek+騰云技術(shù)應(yīng)用沙龍”在長沙成功舉辦。湖南本地企業(yè)開發(fā)者、企業(yè)技術(shù)負(fù)責(zé)人、AI領(lǐng)域研究者及
    的頭像 發(fā)表于 02-26 18:23 ?487次閱讀
    湖南 DeepSeek+<b class='flag-5'>昇</b><b class='flag-5'>騰云</b>技術(shù)應(yīng)用沙龍成功舉辦,拓維信息助力 <b class='flag-5'>AI</b> 新范式探索

    百度李彥宏談訓(xùn)練下一代大模型

    “我們?nèi)孕鑼π酒?shù)據(jù)中心和基礎(chǔ)設(shè)施持續(xù)投入,以打造更好、更智能的下一代模型。”
    的頭像 發(fā)表于 02-12 10:38 ?349次閱讀

    HERE攜手亞馬遜科技創(chuàng)新AI地圖解決方案,加速軟件定義汽車發(fā)展

    HERE與亞馬遜科技簽訂長達(dá)十年、價(jià)值十億美元的基礎(chǔ)設(shè)施合作協(xié)議,為全球汽車、交通、物流和移動出行公司提供AI驅(qū)動的實(shí)時(shí)流地圖和位置服務(wù)支持 HERE與亞馬遜
    的頭像 發(fā)表于 01-15 15:33 ?319次閱讀

    NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

    在孟買舉辦的 NVIDIA AI Summit 上,仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資,這些投資有望為各行各業(yè)帶來變革。
    的頭像 發(fā)表于 10-27 09:44 ?494次閱讀

    國家大力部署 IPv6,打造下一代互聯(lián)網(wǎng)新生態(tài)

    。大力發(fā)展基于IPv6的下一代互聯(lián)網(wǎng),有助于提升我國網(wǎng)絡(luò)信息技術(shù)自主創(chuàng)新能力和產(chǎn)業(yè)高端發(fā)展水平。IPv6能夠高效支撐移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、計(jì)算、大數(shù)據(jù)
    的頭像 發(fā)表于 10-09 13:37 ?931次閱讀
    國家大力部署 IPv6,打造<b class='flag-5'>下一代</b>互聯(lián)網(wǎng)新生態(tài)

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI
    發(fā)表于 08-15 11:06 ?0次下載
    <b class='flag-5'>下一代</b>高功能新<b class='flag-5'>一代</b><b class='flag-5'>AI</b>加速器(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統(tǒng)高級<b class='flag-5'>AI</b>中更快的嵌入處理

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    DPU 是當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新。如果把 CPU 比做大腦,那么 GPU 就好比是肌肉,而 DPU 就是神經(jīng)中樞。CPU 承載了應(yīng)用生態(tài),提供了通用型算力;GPU 提供了高密度各類精度的算
    發(fā)表于 07-24 15:32

    華為AI服務(wù)可適配100多個(gè)大模型

    在近日舉辦的華為開發(fā)者大會2024上,華為常務(wù)董事、華為CEO張平安向全球開發(fā)者們宣布了項(xiàng)重大進(jìn)展——
    的頭像 發(fā)表于 06-24 10:49 ?1080次閱讀

    賽輪思與NVIDIA合作,利用生成式AI打造下一代車內(nèi)體驗(yàn)

    AI 驅(qū)動的移動出行創(chuàng)新企業(yè)與 NVIDIA 合作,打造下一代車內(nèi)體驗(yàn)。
    的頭像 發(fā)表于 05-23 10:12 ?1480次閱讀

    豐田、日產(chǎn)和本田將合作開發(fā)下一代汽車的AI和芯片

    豐田、日產(chǎn)和本田等日本主要汽車制造商確實(shí)計(jì)劃聯(lián)手開發(fā)下一代汽車的軟件,包括在生成式人工智能(AI)和半導(dǎo)體(芯片)等領(lǐng)域進(jìn)行合作。
    的頭像 發(fā)表于 05-20 10:25 ?1205次閱讀
    主站蜘蛛池模板: 美女黄色毛片免费看 | 色内内免费视频播放 | 狠狠色狠狠色综合日日小蛇 | 很黄很黄的网站免费的 | 免费爱爱视频网站 | 91啦视频在线 | 最新日本免费一区二区三区中文 | 色噜噜狠狠色综合中文字幕 | 小屁孩和大人啪啪 | 在线欧美激情 | 五月天欧美 | 久久久久久久久久免免费精品 | 欧美xxxx性特级高清 | 五月天狠狠 | 国产高清成人 | 欧美色性视频 | 亚洲黄色官网 | 男女一进一出无遮挡黄 | 日韩一区二区三区在线 | 天天艹夜夜艹 | 在线 | 一区二区三区四区 | 在线视频一区二区三区四区 | 播色屋| 69性成熟xxxxhd| 欧美亚洲天堂网 | 欧美日韩高清一区 | 三级日韩 | 九色福利 | 五月婷婷啪啪 | 五月激情丁香 | 东京加勒比| 免费黄色网址网站 | 亚洲综合狠狠 | 亚洲第八页 | 久久影视免费体验区午夜啪啪 | 天天伊人网 | 男人你懂的网站 | 国产亚洲一区二区三区啪 | 男人天堂久久 | 五月国产综合视频在线观看 | 欧美日韩性猛交xxxxx免费看 |