在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為超級算力系統發展驅動算網融合架構創新

華為數據通信 ? 來源:華為數據通信 ? 作者:華為數據通信 ? 2022-08-25 09:20 ? 次閱讀

在2022年第六屆未來網絡發展大會上,來自產業界、學術界、研究機構等領域的專家、行業領袖共同探討新型網絡技術的攻關與變革。

華為董事、科學家咨詢委員會主任徐文偉在主題演講中指出,超級算力是智能世界的關鍵需求,未來網絡技術將在三個方面為超級算力系統發展做出貢獻:

采用正交架構、分布式直連拓撲等新技術,持續提升數據中心交換機設備容量、數據中心網絡規模,支持百萬級海量算力節點大規模互聯。

將智能無損網絡技術應用到AI訓練、存儲、HPC等多種場景,把數據中心網絡時延從毫秒級降低到微秒級,減少算力等待算據的空耗周期,將算力發揮到極致。

面向一體化大數據中心、東數西算等新場景,探索長距智能無損網絡、多目標算力路由等新技術,支持全網負載均衡,提供集約化低碳算力服務。

展望未來,算網融合架構的探索需要產學研用的共同努力才能成功,華為將持續基礎理論研究和研發投入,與高校、實驗室、產業界積極開展合作,共同推進未來網絡發展。

以下為演講全文。

一、 超級算力是智能世界2030的關鍵需求

超級算力是智能世界的關鍵需求。

展望2030年的智能世界,人工智能將無所不及,超級算力幫助我們更縱深地感知物理世界,更準確地模擬現實世界、探索未知領域,加速千行百業的數字化和智能化,實現數字世界和物理世界的無縫融合。

預計到2030年,自動駕駛車廠云端需要10 ExaFLOPS,氣象預測數據及算力需求增長1000倍,VR/AR用戶數將超過10億,AI計算的算力將達到105 ZetaFlops,比2021年增長500倍左右,算力就是未來國家的關鍵競爭力。

二、 超級算力系統發展驅動算網融合架構創新

超級算力系統不但需要性能更強的CPUGPU,以及更強大的AI算法、模型,還需要結合未來網絡技術的最新發展,以算網融合架構助力超級算力系統發展。

未來網絡技術研究將在三個方面做出貢獻:

采用正交架構、分布式直連拓撲等新技術,持續提升數據中心交換機設備容量、數據中心網絡規模,支持百萬級海量算力節點大規模互聯。

將智能無損網絡技術應用到AI訓練、存儲、HPC等多種場景,把數據中心網絡時延從毫秒級降低到微秒級,減少算力等待算據的空耗周期,將算力發揮到極致。

面向一體化大數據中心、東數西算等新場景,探索長距智能無損網絡、多目標算力路由等新技術,支持全網負載均衡,提供集約化低碳算力服務。

三、系統架構創新:首創DCN正交架構,實現超大容量,超高密度,線性擴容

為了支持海量算力節點的大規模互聯,我們需要大容量的數據中心交換機設備。傳統框式設備采用PCB背板走線實現板卡槽位之間信號連接,受限于高速信號鏈路衰減,走線長度不能大于40英寸,在框式設備上只能支持8個線卡槽位。

華為在2012年推出的數據中心交換機CloudEngine12800設備,首創“直接正交架構”,采用業務線卡和交換網板90度垂直互連的方式,背板0走線,減少了走線帶來的高速信號鏈路衰減,支持前后風道,數據中心機房無需改造就可以滿足冷熱隔離的要求,整機支持24個40GE線速端口,并且支持線性擴容,是當時業界最高競品的4倍。

同樣基于直接正交架構的新一代數據中心交換機CloudEngine16816,支持16個業務線卡槽位,提供768個400GE端口。

實現正交架構面臨高速信號傳輸、高密度和低損連接器和高效散熱的工程瓶頸。通過系統架構創新和跨學科集成創新,我們突破了多個工程技術瓶頸,連續十年刷新數據中心核心交換機的業界容量極限。

四、 持續提升設備容量:互聯介質技術、散熱技術、分布式架構

在正交架構的技術創新的基礎上,為了持續提升數據中心交換機的設備容量,我們還在研究更高速率的互聯介質技術、更強的散熱技術,并探索更多的設備新架構。

在互聯架構上,從PCB互連演進到了當前的Cable IO互連,未來將走向光IO互連。要實現架構演進,關鍵是在互連介質上要取得突破。我們也在業界推出對傳輸損耗的理論研究公式(如圖),從降低介電材料的Dk和Df以及改善導體材料的光滑度,趨膚效應和導電率來改善介質損耗與導體損耗。

在散熱技術上,我們基于過增元院士的“場協同原理”理論,持續優化散熱速度場/溫度場的“協同數”Fc (如圖),進一步研究從金屬到石墨烯到金剛石的散熱材料突破,挑戰固體導熱材料的極致性能。同時,深入探索沸騰換熱微納表面的加工工藝,拉遠散熱跨尺度/跨材料系統的集成工藝、復雜熱源散熱的拓撲優化工藝的散熱工藝。力爭在散熱技術上獲得突破。

在設備架構上,面向未來,探索從正交架構到直連拓撲的分布式交換機架構的可能性,希望突破設備的容量與供電限制,通過OIO互聯技術完成高密度信號連接,實現單節點更大容量演進。

五、系統架構創新:直連拓撲實現單個DC的百萬級節點聯接

為了支持海量算力節點的大規模互聯,我們還需在數據中心交換機的組網拓撲上進一步創新。目前主流組網拓撲為CLOS架構,以典型的128端口交換機測算,2級CLOS架構最大支持8千個計算節點互聯。

為了實現更大規模的算力互聯,3級CLOS架構最大支持50萬個計算節點互聯,但跳數增加又帶來了時延增加等問題。

華為創新地將直連拓撲引入到以太網絡中,實現超大規模、低跳數的數據中心網絡架構,以128端口交換機測算,最高可支持400萬計算節點互聯,相比2級CLOS架構提升了500倍,跳數不變。

直連拓撲的多路徑環路問題,需要Dijkstra(迪杰斯特拉)算法實現TI-LFA(拓撲無關的無環路備份路徑),存在復雜度高、重路由時間長的問題。華為創新引入圖論方法實現并行Dijkstra(迪杰斯特拉)算法,降低復雜度,將1萬個節點的快速重路由時間從16.7分鐘降低到8s。

六、系統架構創新:智能無損網絡,挑戰零丟包互聯提升AI訓練算力

AI訓練場景中,多臺服務器向一臺服務器同時發送大量報文的情況經常出現,多打一(incast)網絡流量模型是常態。

當報文大量排隊、緩存溢出后,丟包、重傳就會導致GPU等數據的現象,嚴重時CPU資源有50%的時間在空轉。

傳統的流量控制算法在緩存超過一定“水線”時通知發送端,降低流量發送速度,但水線值的設置既不能太溫柔、也不能太粗暴,還要根據計算任務的不同動態調整,不可實施。

華為創造性地引入智能算法代替專家經驗,用流量數據、流量模型進行實時推理,得出最優ECN水線值,實現實時、精準的AI ECN流量控制。

為了確保算法可以自適應任何流量場景和模型,除了百萬級的真實業務樣本外,還加入了千萬級的隨機樣本訓練,可以保證在不同場景下無損算力互聯。

依據《ODCC無損網絡測試基準》,ODCC 2020年進行了實測,采用智能無損網絡架構改造后,能效比提升了25%~31%,這相當于節省了25%的GPU投資,具有較大商業價值。

某重點實驗室算力強大(4096個NPU+1024CPU),但AI訓練場景下,網絡HASH不均導致有效吞吐低,IO500打榜中網絡吞吐僅達到約50%,影響AI計算效率。

全網采用智能無損網絡后,單任務場景網絡吞吐從50%提升到90%。在IO500總榜、IO500十節點榜以及AIPerf榜都排名第一,且得分大幅領先上屆冠軍。IO500總榜得分4倍于第二名

七、智能無損網絡在存儲、HPC場景的性能超越FC、持平IB

在存儲場景中,傳統的光纖通道(FC)網絡不匹配全閃存NVMe接口下的并行式大吞吐讀寫模式,帶寬和時延已成為性能瓶頸。以太在帶寬上相比FiberChannel具有明顯優勢,一家全球領先的大型銀行率先采用智能無損網絡替代FiberChannel,部署全閃存數據中心,生產系統存儲性能提升85%。

在HPC場景,智能無損網絡可以將集合通信的部分計算操作從服務器轉移到交換機網絡設備,減少了服務器集群間的通信量,從而大幅降低了HPC小字節場景下的網絡時延,提升了計算效率。

東莞大科學計算中心實驗室需超大算力支持仿真與科學計算,使用智能無損網絡技術替代InfiniBand,計算性能持平,特定計算任務場景略有超越,我們還在持續優化,爭取實現全面領先。

智能無損網絡性能超越IB的場景還有:氣象預報WRF、CESM等用例;汽車碰撞Pam-crash用例;AI計算AIPerf BenchMark套件用例。

八、從DCN到DCI到全國一體化大數據中心,堅持系統架構創新

繼DC內部的智能無損網絡之后,我們在同城智能無損網絡也有進展,突破了iLossless-DCI算法,攻克100G以太網100公里0丟包難題,實現同城長距無損,并主導IEEE長距無損網絡相關的技術規范;一家全球領先的大型銀行在跨DC雙活同城數據同步中,采用長距無損技術實現0丟包NoF+存儲網絡,用100G以太替換8G FC,鏈路數減少90%,每年節省2000多萬元;

下一步是全國一朵云、一張網的問題,延續網絡架構+軟件創新思路,探索多目標路由來實現跨資源池一體化調度、探索廣域智能無損實現1000公里級400G算力網絡高吞吐。

九、全國一體化大數據中心,探索多目標算力路由、廣域智能無損

面向全國一體化數據中心的場景,在控制面探索多目標算力路由,在數據面探索廣域智能無損;

多目標算力路由的思路是,通過新的網絡和軟件協同,將一個業務拆分為多個子任務,用多目標算力路由來實現跨數據中心資源池的統一調度、協同計算、算網融合;這種情況下,算力-運力圖的劃分與組合眾多,多目標算力路由是就是從眾多組合中找出業務綜合服務水平SLA與總和成本這兩個目標上的最優;

這是典型的多目標優化問題,也稱為帕累托(Pareto)最優問題,傳統的多目標加權轉化方法覆蓋低,需要探索其他途徑如矢量分解結合演化計算來提升最優Pareto覆蓋;

面向全國一張網場景,廣域智能無損網絡還需要解決廣域網絡距離長反饋慢、路徑多、均衡難、業務吞吐低的難題,支持全國一體化大數據中心的發展;需要探索廣域網絡擁塞控制新算法、網絡負載均衡新技術、下一代鏈路流控協議等,以期獲得廣域高吞吐性能。

十、架構創新、技術突破,實現未來算網融合目標(2030)

a4e21426-23ae-11ed-ba43-dac502259ad0.jpg面向未來,要實現算網融合的目標,通過更大的聯接與算力,支撐面向未來的真人全息、自動駕駛、XR等場景和隨時隨地10G Everywhere的需求

一方面,我們需要從架構創新與技術突破方面努力實現單級設備容量的突破,端口速率從400G到3.2T,單片容量從25.6T到400T以上,系統容量從512T到10P以上

另外一方面,我們也需要支撐擴展到百萬級的數據中心規模,微秒級的時延和整網級甚至全國一張網的負載均衡能力。

十一、合作共贏加速未來網絡發展

a4e21426-23ae-11ed-ba43-dac502259ad0.jpg要實現算網融合架構,加速未來網絡發展,需要靠各位院士、科學家、專家、上下游產業和客戶共同努力才能成功,同時我們也要重視網絡、ICT和數字人才的長期培養。

一方面,華為我們自身也在基礎實驗室建設,基礎理論研究和研發方面加大投入;更重要的,我們希望和行業的科學家和專家共同探討未來,和知名大學共同研究理論與技術。當然我們尤其非常重視合作實驗室創新驗證,就像我們和未來網絡實驗室有很多合作。

所以我們希望和大家共同努力,合作共贏加速未來網絡發展。謝謝!

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    34557

    瀏覽量

    253232
  • AI
    AI
    +關注

    關注

    87

    文章

    31834

    瀏覽量

    270598
  • 大數據
    +關注

    關注

    64

    文章

    8912

    瀏覽量

    137871

原文標題:華為徐文偉:融合算網架構,共贏未來網絡

文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數據通信】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    大模型遭遇力墻,探索超級應用的發展路徑

    最近,開源中國 OSCHINA、Gitee 與 Gitee AI? 全文如下: 大模型撞上 “力墻”,超級應用的探尋之路 文 / 傅聰 近日,大模型教父 Sam Altman 在 Reddit 上
    的頭像 發表于 02-10 17:24 ?75次閱讀
    大模型遭遇<b class='flag-5'>算</b>力墻,探索<b class='flag-5'>超級</b>應用的<b class='flag-5'>發展</b>路徑

    中心的力如何衡量?

    作為當下科技發展的重要基礎設施,其力的衡量關乎其能否高效支撐人工智能、大數據分析等智能應用的運行。以下是對智中心算力衡量的詳細闡述:一、力的基本定義與單位1、
    的頭像 發表于 01-16 14:03 ?591次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b>力如何衡量?

    鯤云科技亮相北京智協同創新大會

    2025 年 1 月 14 日,北京智協同創新大會在在北京海淀區集智未來人工智能產業創新基地隆重舉行,會上成立北京智創新研究院,正式肩負
    的頭像 發表于 01-14 18:10 ?347次閱讀

    融合 南京信易達發布全新“智能融合平臺”

    1月7日,南京信易達發布了旗下最新力平臺“C-MOM智能融合平臺V3.0”,并更新了全新的UI視覺與交互系統。 該平臺集成了HPC超
    的頭像 發表于 01-08 10:56 ?167次閱讀
    超<b class='flag-5'>算</b>智<b class='flag-5'>算</b><b class='flag-5'>融合</b> 南京信易達發布全新“智能<b class='flag-5'>算</b>力<b class='flag-5'>融合</b>平臺”

    家計算 開啟貴州人工智能力服務新篇章

    伴隨數字化轉型加速及 “人工智能 +” 行動規劃的推進,力已成企業創新與業務增長的關鍵驅動力,其市場需求暴增,企業亟需高效經濟的力解決方案。在此背景下,由貴州省貴安
    的頭像 發表于 12-27 00:37 ?235次閱讀
    <b class='flag-5'>算</b>家計算 開啟貴州人工智能<b class='flag-5'>算</b>力服務新篇章

    華為榮獲2024年力網絡產業十大創新成果獎

    在2024中國信息通信大會期間,力網絡一體創新發展分論壇成功舉辦。眾多中國工程院院士、中國科學院院士、智網絡領域的專家和學者共同探討
    的頭像 發表于 12-04 11:10 ?625次閱讀

    華為受邀出席力產業發展方陣全體會議

    近日,力產業發展方陣(以下簡稱“方陣”)全體會議在合肥順利舉辦,該方陣在工業和信息化部指導下,由中國信息通信研究院牽頭成立。華為數據中心網絡解決方案資深架構師林藝宏受邀參會
    的頭像 發表于 11-05 13:34 ?365次閱讀

    一體架構創新助力國產大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《存一體架構創新助力國產大力AI芯片騰飛》的演講。
    的頭像 發表于 10-23 14:48 ?438次閱讀

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解力芯片。 全書共11章,由淺入深,較系統全面進行講解。下面目錄對全書
    發表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    社會資源和資本力量關注力芯片的發展,希望我們的國家能夠更獨立自主地設計制造高性能力芯片。 內容簡介: 本書介紹了超級計算機力和AI
    發表于 09-02 10:09

    長沙角逐力江湖,長沙市新一代智產業生態聯合體成立

    、景嘉微、湘江鯤鵬、長沙人工智能創新中心等14家行業領軍的科研、企業合力。未來新一代智產業生態聯合體將在智基礎軟件與生態、超
    的頭像 發表于 08-30 11:14 ?648次閱讀

    見證“硬”實力!兆瀚CA9900 A2 AI集群獲評2023年基礎設施優秀案例

    秉承“開放、創新融合、共贏”發展戰略,7月10日,中國通信標準化協會融合產業及標準推進委員
    的頭像 發表于 07-11 08:15 ?429次閱讀
    見證“硬”實力!兆瀚CA9900 A2 AI集群獲評2023年<b class='flag-5'>算</b><b class='flag-5'>網</b>基礎設施優秀案例

    力系列基礎篇——力與計算機性能:解鎖超能力的神秘力量!

    在《力系列基礎篇——力101:從零開始了解力》中,相信各位粉絲初步了解到人工智能的“發動機”和核心驅動力:
    的頭像 發表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力系</b>列基礎篇——<b class='flag-5'>算</b>力與計算機性能:解鎖超能力的神秘力量!

    力系統集成指什么

    集成的目標是為用戶提供一個統一的、可擴展的、高性能的計算環境,以滿足不同應用場景的需求。 力系統集成的背景和意義 隨著信息技術的快速發展,數據量呈現爆炸式增長,對計算能力的需求也越來越高。傳統的計算模式已
    的頭像 發表于 07-03 14:07 ?558次閱讀

    力系列基礎篇——力101:從零開始了解

    相信大家已經感受到,我們正處在一個人工智能時代。如果要問在人工智能時代最重要的是什么?那必須是:力!力!力!(重要的事情說三遍)作為推動人工智能發展的三大要素之一,
    的頭像 發表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力系</b>列基礎篇——<b class='flag-5'>算</b>力101:從零開始了解<b class='flag-5'>算</b>力
    主站蜘蛛池模板: 天天做天天爰夜夜爽 | 激情在线网站 | 极品美女写真菠萝蜜视频 | 天天做夜夜爽 | 91精品国产免费久久久久久青草 | 高清一区二区 | 国产精品一区电影 | 一级看片免费视频囗交 | 女主播扒开内衣让粉丝看个够 | 久视频在线观看久视频 | 啪啪网免费视频 | 免费观看a毛片一区二区不卡 | 成人免费看片视频色多多 | 亚洲欧美日韩特级毛片 | 男啪女色黄无遮挡免费观看 | 亚洲乱码尤物193yw在线播放 | 久久精品视频99精品视频150 | 69国产成人综合久久精品 | 男人在线网站 | 午夜免费免费啪视频观看 | 成人国产精品2021 | 在线播放91灌醉迷j高跟美女 | 丁香婷婷亚洲六月综合色 | 四虎国产成人亚洲精品 | 久久精品国产大片免费观看 | 免费国产一区 | 天天躁狠狠躁夜夜躁2021 | 亚洲bbb | bt天堂网在线资源www | 色婷婷激情五月综合 | 日产国产精品亚洲系列 | 国产成年女一区二区三区 | 中日韩免费视频 | 亚洲线精品一区二区三区 | 午夜久久久 | 四虎在线观看一区二区 | 朱元璋传奇1998王耿豪版 | 激情综合亚洲 | 午夜免费啪在线观看视频网站 | 末满18以下勿进色禁网站 | 六月婷婷网视频在线观看 |