華為超融合數(shù)據(jù)中心網(wǎng)絡(luò)支撐科研完成算力飛躍,大大提升了作業(yè)效率。有了智能無損高性能計(jì)算網(wǎng)絡(luò)的加持,北大學(xué)子能夠更從容地面對Deadline,助力科研更上一層樓。
“趕實(shí)驗(yàn)工期,臨時要緊急跑個任務(wù),計(jì)算資源排隊(duì)時間太長怎么辦?” “下周就是Deadline了,突然發(fā)現(xiàn)實(shí)驗(yàn)數(shù)據(jù)有問題,重新模擬運(yùn)行要100多個小時,有沒有更快的方法啊?” “這個實(shí)驗(yàn)對我特別重要,馬上要來不及了,師兄師姐能不能讓我先跑一遍?” 曾經(jīng),讓科研人最頭疼的不只是分子運(yùn)動、DNA構(gòu)成和風(fēng)洞實(shí)驗(yàn),也不只是繁瑣的模型制作和模擬實(shí)驗(yàn),還有跟實(shí)驗(yàn)室的師兄師姐搶計(jì)算資源,漫長的排隊(duì)和長時間的運(yùn)行等待。 為了提升高性能計(jì)算的效率,降低科研成本,北京大學(xué)(以下簡稱“北大”)高性能計(jì)算校級公共平臺組織了一次廠家“考核”,意在選出智能時代最優(yōu)的高性能計(jì)算網(wǎng)絡(luò),華為智能無損高性能計(jì)算網(wǎng)絡(luò)因計(jì)算結(jié)果最優(yōu)拔得頭籌。
成績斐然的計(jì)算中心
1963年北大擁有第一臺計(jì)算機(jī)時,就在全國高校中率先成立了計(jì)算中心。2001年學(xué)校匯集多個領(lǐng)域的專家成立了北大科學(xué)與工程計(jì)算中心,搭建了一個具有多學(xué)科交叉性質(zhì)的研究平臺,服務(wù)全校教學(xué)科研,取得良好效益。2018年高性能計(jì)算校級公共平臺揭牌啟用,“未名一號”、“未名教學(xué)一號”和“未名生科一號”三套集群陸續(xù)投入運(yùn)行,公共平臺的計(jì)算總核心數(shù)達(dá)31,732個,峰值計(jì)算能力為3.65pflops。平臺為數(shù)學(xué)、力學(xué)、物理學(xué)、化學(xué)、生物學(xué)、地球科學(xué)等學(xué)科提供了高性能計(jì)算環(huán)境,可謂“上知天文,下知地理”。
眾口能調(diào),科研支撐
高性能計(jì)算平臺是一所大學(xué)重要的科研支撐條件,用于提高科學(xué)研究水平、推動工程技術(shù)創(chuàng)新。截至2023年5月12日,北大高性能平臺共有師生用戶5070人,分布在全校96個院系單位。已知支撐科研課題超545項(xiàng),總金額達(dá)31.36億元,科研論文1400多篇,并支撐了2020年戈登貝爾獎的發(fā)布。該獲獎項(xiàng)目通過機(jī)器學(xué)習(xí)將分子動力學(xué)模擬極限提升到1億原子的驚人數(shù)量,被認(rèn)為是當(dāng)今計(jì)算科學(xué)領(lǐng)域中最令人興奮的重大進(jìn)展。
使用需求高漲,改造迫在眉睫
隨著平臺使用人數(shù)的增加,用戶的作業(yè)量逐漸超過了平臺能力,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的流量吞吐量和復(fù)雜性都大大增加。以“未名生科一號”為例,節(jié)點(diǎn)的占用率長期處于95%以上居高不下,作業(yè)運(yùn)行時間最高達(dá)109小時,排隊(duì)時間最高550小時,系統(tǒng)及網(wǎng)絡(luò)改造迫在眉睫。
圖?“未名一號”運(yùn)行狀態(tài)
針對排隊(duì)和作業(yè)時間過長的問題,各廠商先后提出IB(Infiniband)、RoCEv1、RoCEv2等無損網(wǎng)絡(luò)技術(shù)。通過嚴(yán)格測試,北京大學(xué)高性能計(jì)算校級公共平臺選擇采用華為超融合數(shù)據(jù)中心網(wǎng)絡(luò)CloudFabric 3.0解決方案,基于智能無損高性能計(jì)算網(wǎng)絡(luò)搭建高性能計(jì)算集群,100%釋放算力,縮短作業(yè)運(yùn)行時間和排隊(duì)時間。
華為智能無損高性能計(jì)算網(wǎng)絡(luò)
助力北大提升科研效率
此次測試主要關(guān)注TCP/IP、IB和RoCEv2分別在高性能計(jì)算基準(zhǔn)測試工具Linpack、地球系統(tǒng)模式CESM以及分子動力學(xué)軟件VASP等應(yīng)用場景中的測評結(jié)果。
實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),在VASP測試中,華為智能無損高性能計(jì)算網(wǎng)絡(luò)100GE RoCEv2優(yōu)于IB;在Linpack和CESM測試中,華為智能無損高性能計(jì)算網(wǎng)絡(luò)100GE RoCEv2與IB性能表現(xiàn)基本一致,也證實(shí)了在真實(shí)應(yīng)用場景下華為智能無損高性能計(jì)算網(wǎng)絡(luò)可以代替IB。
華為智能無損高性能計(jì)算網(wǎng)絡(luò)解決方案獨(dú)家實(shí)現(xiàn)以太網(wǎng)0丟包,與傳統(tǒng)以太網(wǎng)相比,可實(shí)現(xiàn)服務(wù)器規(guī)模不變,算力翻番;可提供業(yè)界最高密768*400GE交換機(jī)CloudEngine 16800,可構(gòu)建10E級的超大規(guī)模算力集群;獨(dú)家實(shí)現(xiàn)網(wǎng)算一體,網(wǎng)絡(luò)協(xié)助計(jì)算,經(jīng)第三方權(quán)威測試機(jī)構(gòu)Tolly認(rèn)證,任務(wù)完成時間(JCT)對比IB 縮短 17%。
北大高性能計(jì)算校級平臺擁有國內(nèi)領(lǐng)先的超算集群,全系統(tǒng)Linpack效率常年位居前列,對網(wǎng)絡(luò)性能、可靠性和先進(jìn)性要求都非常高。此次測試結(jié)果加深超算行業(yè)技術(shù)圈對華為超融合數(shù)據(jù)中心網(wǎng)絡(luò)全無損以太的充分認(rèn)可。未來,華為智能無損高性能計(jì)算網(wǎng)絡(luò)將更廣泛地應(yīng)用于教育、科研等領(lǐng)域,為國家科學(xué)計(jì)算、工程技術(shù)創(chuàng)新、高精尖科研添磚加瓦。
-
華為
+關(guān)注
關(guān)注
216文章
34988瀏覽量
254857
原文標(biāo)題:百大案例 | 北京大學(xué):華為智能無損高性能計(jì)算網(wǎng)絡(luò),助力科研乘風(fēng)破浪
文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
開售RK3576 高性能人工智能主板
香橙派AIpro(20T)走進(jìn)北京大學(xué)、上海交通大學(xué)等高校鯤鵬昇騰科教創(chuàng)新卓越中心特訓(xùn)營

信而泰PFC/ECN流量測試方案:打造智能無損網(wǎng)絡(luò)的關(guān)鍵利器

中軟國際助力北京理工大學(xué)珠海校區(qū)展開科研創(chuàng)新
華為智算實(shí)驗(yàn)室解決方案助力科研創(chuàng)新高質(zhì)量發(fā)展
清華大學(xué)與華為啟動“卓越中心”專項(xiàng)合作
凝“芯”聚“心”共赴芯征程丨深圳市學(xué)府一小與北京大學(xué)深圳芯片重點(diǎn)實(shí)驗(yàn)室開展重要互訪交流

【飛凌嵌入式2024年度盤點(diǎn)】乘風(fēng)破浪,奮力前行

CES?Asia?2025為何立足北京?

北京大學(xué)在集成光學(xué)相關(guān)研究取得進(jìn)展

北京大學(xué)研究團(tuán)隊(duì)在新型激光領(lǐng)域取得重要進(jìn)展

RISC-V AI技術(shù)正式納入北京大學(xué)研究生課程

北京化工大學(xué)與和晟儀器攜手,共筑科研新高地

北京大學(xué)謝濤:基于RISC-V構(gòu)建AI算力的優(yōu)勢和兩種模式
引領(lǐng)高校原生人才新生態(tài) 北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心正式成立

評論