在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

萬卡集群解決大模型訓算力需求,建設面臨哪些挑戰

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2024-06-02 06:18 ? 次閱讀



電子發燒友網報道(文/李彎彎)萬卡集群是指由一萬張及以上的加速卡(包括GPU、TPU及其他專用AI加速芯片)組成的高性能計算系統,主要用于加速人工智能模型的訓練和推理過程。這種集群的構建旨在解決大模型訓練對算力需求的巨大增長問題,尤其是現在模型參數量從百億級、千億級邁向萬億級。

國內外企業積極構建萬卡集群

目前,在國際上,包括微軟、Google、Meta等AI領域的巨頭,都已落子超萬卡集群的項目部署。如Meta于2022年推出了擁有16000張算卡的超級集群中心;Google于2023年推出了一個擁有2.6萬張算卡的Compute Engine A3;而持有OpenAI的微軟更是傳出正在進行百萬規模算卡集群的籌建。

不只是國際廠商,國內廠商也在此前大量采購GPU推進萬卡集群建設。尤其在今年以來,三大運營商也相繼公布了對超萬卡集群的部署。

近日,在中國移動算力網絡大會上,中國移動副總經理高同慶宣布,今年將商用哈爾濱、呼和浩特、貴陽的三個萬卡集群,總規模近6萬張GPU卡,充分滿足大模型集中訓練的需求。

今年1月,中國電信宣布將在上海規劃建設1.5萬張卡規模的算力集群,其總算力超4500P,這也將是國內首個超大規模國產算力液冷集群。中國聯通表示,在今年內將在上海臨港國際云數據中心,建成中國聯通首個萬卡集群。

除了運營商之外,2023年,螞蟻集團宣布已建成萬卡異構算力集群。此外,包括字節跳動、阿里、百度、華為及科大訊飛等在內的互聯網和AI頭部企業均在發力萬卡集群的建設。

另外,今年5月20日,網宿科技與航錦科技正式簽署戰略合作協議,雙方圍繞NVIDIA最新一代萬卡集群(L20 cluster AIDC)項目建立戰略合作關系,共同開展智算中心建設、相關技術研發、市場拓展等工作,旨在打造高效、智能、綠色的算力基礎設施,承載千行百業的大模型訓練及推理需求。

網宿科技是全球領先的信息基礎設施平臺服務提供商,專注于邊緣計算、云分發、云安全、云計算、云服務及綠色數據中心業務。航錦科技是由武漢市國資委控股的上市企業,控股子公司超擎數智作為AI算力和網絡整體解決方案提供商,是NVIDIA Compute(GPU)、Networking(網絡)的雙Elite精英級合作伙伴。

構建萬卡集群面臨的挑戰

萬卡集群的建設和維護面臨諸多挑戰,首先是GPU的供應,由于全球超萬卡集群的建設都處于起步階段,部署模式都以英偉達GPU及配套設備為主。目前國內在獲得英偉達旗艦高性能GPU方面受限,同時,國產AI芯片相比于英偉達GPU在性能上存在一定差距。

其次,在大模型場景下,算力需要大規模集中式訓練,單個GPU無法完全容納整個模型訓練,需要采用分布式訓練。這會帶來GPU之間互聯帶寬受限或AI服務器之間網絡互聯帶寬有限的問題。此外,卡數量增多后,過熱、故障也會一定比例出現,模型訓練成本會增加。

當然,目前各企業正在積極解決這些問題。如越來越多國產的AI芯片已經開始在集群的建設中得到使用,包括華為、海光、寒武紀、摩爾線程等公司。

如為了支撐千卡乃至超萬卡的大規模算力集群,摩爾線程于2023年推出了首個國內產千卡千億模型訓練平臺——夸娥智算集群,該模型深度參與中國移動大模型訓練與推理環節,可以為大模型訓練提供穩定、高效、高兼容的算力支撐。

摩爾線程相關負責人此前談到,百卡或更小規模都是實驗性的,千卡才是大集群的基本單元,只有千卡及以上才能滿足一些基礎模型的算力需求,這也是推出夸娥智算集群的目標設定。

另外,浪潮信息董事長彭震日前談到,芯片算力并非是AI發展不起來的直接原因,更多的其實是系統問題。他認為,對于服務器廠商而言,當前已經不能再局限于提供單一硬件產品,而是要綜合性解決方案,這些解決方案可能包括服務器、存儲、網絡、安全等方面。

浪潮信息希望從算力層提供一個平臺,支撐多元算力入駐。對于芯片企業而言,只需要專注在芯片本身而不需要研究互聯帶寬問題。

據了解,目前不少服務器廠商也在學習英偉達的NVlink,NVlink提供一種高效可擴展的芯片通信間協議,允許所有GPU同時全速實時通信,就好像整個系統是單個GPU一樣。在今年4月的GTC大會上,英偉達還宣布NVlink更新到第五代,包括可擴展至576個GPU,能夠解決萬億參數混合專家模型通信瓶頸。

新華三集團高級副總裁、云與計算存儲產品線總裁徐潤安此前也談到算力互聯。在他看來,過去,大家的目標可能是做更強算力的單顆芯片,現在會從另一個角度努力,怎樣將芯片做成更大集群,同時使得集群的通信效果更高,集群的處理能力更強。

新華三希望做更加開放的平臺,做上游GPU廠商合作伙伴的最佳選擇,利用自身網絡優勢,對網絡通信的理解,幫助更多GPU廠商,將算力互聯互通實現得更好。新華三提供的科學計算算力調度平臺傲飛3.0,實現了跨集群統一管理,將訓練任務進行切分,將合適的子任務放在合適的近端或遠端模塊集群實現。

寫在最后

當前,萬卡集群式應對大模型背景下算力需求的重要解決方案之一,對于推動人工智能技術的發展和應用具有重要意義。可以看到,國內外都在積極推進萬卡集群的建設。然而,在國內,萬卡集群的建設并不容易,首先是AI芯片性能及軟件生態存在差距,其次是萬卡集群建設存在芯片間、卡之間、集群間的互聯問題,這些都還需要持續去解決。











聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算力
    +關注

    關注

    1

    文章

    1023

    瀏覽量

    14972
  • 大模型
    +關注

    關注

    2

    文章

    2601

    瀏覽量

    3213
收藏 人收藏

    評論

    相關推薦

    國產千GPU集群完成大模型訓練測試,極具高兼容性和穩定性

    電子發燒友網報道(文/李彎彎)隨著人工智能技術的快速發展,對于計算能力的需求日益增長。特別是在大模型訓練方面,對需求更是呈現指數級增長
    的頭像 發表于 06-11 07:50 ?3471次閱讀
    國產千<b class='flag-5'>卡</b>GPU<b class='flag-5'>集群</b>完成大<b class='flag-5'>模型</b>訓練測試,極具高兼容性和穩定性

    昆侖芯P800集群成功點亮,將進一步點亮3集群

    的。而24年9月升級的百度百舸AI異構計算平臺4.0,圍繞落地大模型全旅程的需求,在集群創建、開發實驗、
    發表于 02-05 17:58 ?120次閱讀
    昆侖芯P800<b class='flag-5'>萬</b><b class='flag-5'>卡</b><b class='flag-5'>集群</b>成功點亮,將進一步點亮3<b class='flag-5'>萬</b><b class='flag-5'>卡</b><b class='flag-5'>集群</b>

    弘信電子旗下安聯通加入集群服務推進方陣

    近日,中國信息通信研究院(以下簡稱“信通院”)在北京召開“集群服務推進方陣”首次工作部署會議。弘信電子集團旗下子公司安聯通受邀出席,展現了其在智
    的頭像 發表于 01-16 11:18 ?325次閱讀

    國產智集群黑馬!曦源一號SADA集群綜合評測表現優異

    近日,加佳科技曦源一號SADA集群項目一期順利通過工信部中國軟件評測中心權威評測認證。本次測試涵蓋了項目一期已上線的1024張沐曦高性能GPU加速
    的頭像 發表于 12-25 11:16 ?407次閱讀
    國產智<b class='flag-5'>算</b><b class='flag-5'>集群</b>黑馬!曦源一號SADA<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>集群</b>綜合評測表現優異

    星凡星啟,全面助力集群建設

    ,同時地面建設100個地基推一體化節點,建成后總算預計將達到80000P。“星算計劃”打造的地面
    的頭像 發表于 12-10 11:36 ?420次閱讀
    星凡星啟,全面助力<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>集群</b><b class='flag-5'>建設</b>

    【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受

    國慶前就收到《大模型時代的基礎架構》一書,感謝電子發燒友論壇。歡度國慶之余,今天才靜下心來體驗此書,書不厚,200余頁,彩色圖例,印刷精美! 當初申請此書,主要是看到副標題“大模型
    發表于 10-08 10:40

    模型時代的需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問
    發表于 08-20 09:04

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型中心建設指南

    工作日內未聯系,視為放棄本次試用評測資格! 書籍介紹 大模型是近年來引人注目的熱點之一。大模型蓬勃發展的基礎,是針對其需求設計的及基礎架
    發表于 08-16 18:33

    億鑄科技談大芯片面臨的技術挑戰和解決策略

    隨著人工智能技術的飛速發展,已成為推動產業變革的關鍵力量,但大模型的快速發展,參數的爆發,對于
    的頭像 發表于 08-07 10:03 ?942次閱讀

    從千集群卡到集群,燧原科技打造更好的AI底座

    :WAIC 2024)上,不僅有國內各大模型廠商同場競技,也有豐富的基礎設施展示,其中包括專注人工智能領域云端產品的燧原科技。 ?
    的頭像 發表于 07-07 09:45 ?2460次閱讀
    從千<b class='flag-5'>卡</b><b class='flag-5'>集群</b>卡到<b class='flag-5'>萬</b><b class='flag-5'>卡</b><b class='flag-5'>集群</b>,燧原科技打造更好的AI<b class='flag-5'>算</b><b class='flag-5'>力</b>底座

    摩爾線程與無問芯穹宣布完成基于GPU千集群的3B規模大模型

    摩爾線程聯合無問芯穹宣布,雙方已在本周正式完成基于國產全功能GPU千集群的3B規模大模型
    的頭像 發表于 05-27 10:44 ?534次閱讀
    摩爾線程與無問芯穹宣布完成基于GPU千<b class='flag-5'>卡</b><b class='flag-5'>集群</b>的3B規模大<b class='flag-5'>模型</b>實<b class='flag-5'>訓</b>

    摩爾線程張建中:以國產助力數智世界,滿足大模型需求

    摩爾線程創始人兼CEO張建中在會上透露,為了滿足國內對AI的迫切需求,他們正在積極尋求與國內頂尖科研機構的深度合作,共同推動更大規模的AI智
    的頭像 發表于 05-10 16:36 ?1038次閱讀

    中國移動將商用三個自主可控集群

    中國移動在近日舉辦的2024年網絡大會上宣布了重要計劃。據中國移動副總經理高同慶透露,公司今年將正式商用三個具有完全自主控制權的集群
    的頭像 發表于 05-06 10:21 ?635次閱讀

    北京:規劃建設支撐萬億級參數大模型訓練需求的超大規模智集群

    ”局面,集中建設一批智單一大集群,到2025年,本市智供給規模達到45EFLOPS,2025-2027年根據人工智能大模型發展需要和國家
    的頭像 發表于 04-29 08:26 ?360次閱讀
    北京:規劃<b class='flag-5'>建設</b>支撐萬億級參數大<b class='flag-5'>模型</b>訓練<b class='flag-5'>需求</b>的超大規模智<b class='flag-5'>算</b><b class='flag-5'>集群</b>

    中國電信規劃在上海建設首個國產超大規模液冷集群

    中國電信規劃建設首個國產超大規模液冷集群 人工智能技術的快速發展催生了巨大的
    的頭像 發表于 02-22 18:48 ?1364次閱讀
    主站蜘蛛池模板: 天天干天天操天天透 | 35pao强力打造 | 色网站在线 | 综合色久七七综合七七蜜芽 | 欧美一二区视频 | 在线观看三级视频 | 特级黄视频| 性欧美成人依依影院 | 国产精品欧美一区二区三区不卡 | 色综合综合网 | 亚洲欧美国产五月天综合 | 国产成人a| 在线观看一区二区三区视频 | 久久人人澡 | 人人插人人爱 | 激情理论片 | 13日本xxxxxxxxx18 1515hh四虎免费观38com | 在线免费看污视频 | 黄色在线视频网 | 一级毛片q片 | 午夜久久久久久亚洲国产精品 | 苍井优一级毛片免费观看 | 天堂网在线资源www最新版 | 波多野结衣中文字幕教师 | 男人日女人视频在线观看 | 日本不卡视频在线观看 | 日韩欧美视频在线一区二区 | 四虎永久影院永久影库 | 亚洲国产精品热久久2022 | 性感美女毛片 | 久久亚洲免费视频 | 正在播放亚洲一区 | 久久久久青草 | 婷婷亚洲综合一区二区 | 亚洲swag精品自拍一区 | 天天操天天射天天爽 | 成人性视频网站 | 噜噜噜 综合 亚洲 | 国产深夜福利在线观看网站 | 免费一级特黄 | 偷偷操不一样的久久 |