近日,國際組織TOP 500發(fā)布了全球超級計算機500強最新榜單,美國超算“頂點”奪冠。此前曾四連冠的中國“神威·太湖之光”位居亞軍。不過,在上榜超算總數(shù)上,中國仍居第一。中科院計算機研究所并行軟件實驗室主任張云泉對此發(fā)表了一定的見解:對美國超算是如何反超中國、中國超算存在的問題以及中國超算的未來做出了分析。
美國超算Summit超過神威·太湖之光,在最新的全球超級計算機500強榜單中排名第一。
6月25日公布的超算TOP500的前十名
美國如何重返榜首
超算TOP500每年發(fā)布兩次,我們國家的天河2號和太湖之光,分別六次和四次拿到冠軍,一共十次,相當于連續(xù)五年占據(jù)了TOP500的冠軍位置。
超級計算機“神威·太湖之光”
美國政府為此很著急。
之前由于奧巴馬政府對超算不夠重視,奧巴馬只是在第二個任期快結束的時候才發(fā)布了一項總統(tǒng)令,加快超算研制的創(chuàng)新步伐。 而特朗普就任以后,卻對超算極其重視,在砍掉了很多科學研究預算的情況下,超算的預算不但沒砍,反而增加了。
幾年前,美國部署了三臺百P(相當于十億億次)量級的超級計算機,每秒的運算速度可以達到100P到200P左右,分別是Summit、Sierra、Aurora三臺機器。目標有三個:第一當然是為美國的國家實驗室研發(fā)世界領先的超級計算模擬系統(tǒng),保持美國科學創(chuàng)新的領導地位;第二是希望保持美國在超級計算機研制上的技術優(yōu)勢和領先水平;第三就是希望把TOP500第一的位置奪回來。
為此美國大概撥款了5個億美元的預算,計劃在2018年年底推出第一臺機器,重返Top500榜首。
但是美國終究無法繼續(xù)容忍中國再霸占世界TOP500的冠軍位置半年,將原來的計劃提前了半年,于今年6月份就調整計劃推出了Summit、Sierra兩臺機器,作為雙保險爭奪世界第一,Summit直接將峰值性能提升到200P,終于如愿奪回世界第一的位置,美國也松了一口氣,重新找到老大的感覺。
其實,美國最早是想用峰值180P的Aurora來作為種子選手爭奪世界第一的,但是由于英特爾負責研制的新Xeon Phil加速器無法按期完成,只好修改合同,直接去研發(fā)2021年完成的百億億次超級計算機A21。
美國超級計算機Summit
此前中國的超算如何奪得多次冠軍?
如果畫一條中國超算的性能發(fā)展曲線的話,可以看到,中國的超算實際上是從一窮二白做起的。在2002年之前,TOP500上就沒有中國的超算,或者說中國超算本身就很少。從2002年之后,經(jīng)過15年的高速發(fā)展,中國超算的上榜數(shù)量,包括性能都是指數(shù)級增長,以旱地拔蔥的方式一躍而起。
中國超算的跨越式發(fā)展
原來是美日歐三大集團瓜分世界超算TOP500的前三名,像馬拉松一樣,他們平穩(wěn)地跑在第一方陣。而中國就屬于從隊尾直接沖到了第一方陣中的選手,我們超過了第三名的歐盟,超過了第二名的日本,最后又超過了美國,成為世界第一。15年的時間很不容易,從一窮二白到最后成為世界第一,中國超算機器的研發(fā)水平,現(xiàn)在確實是世界領先的,處在第一方陣的靠前水平。
中國超算走過了一條比較特殊的路,就是機器發(fā)展拉動應用需求,也就是說我們機器的水平是超過了應用需求的。這是一種政府主導的快速發(fā)展模式。這個路現(xiàn)在是比較成功的。我們機器發(fā)展比較快,也帶動應用的水平快速提升。但是未來我們希望能夠用5到10年的時間,把這種發(fā)展模式轉變成應用需求來拉動機器發(fā)展,這樣更科學更合理。這種發(fā)展模式,也是西方發(fā)達國家現(xiàn)在的發(fā)展模式。
現(xiàn)在來看,我們已經(jīng)連續(xù)兩年拿了戈登貝爾獎(編者注:該獎設立于1987年,主要頒發(fā)給高性能應用領域最杰出成就,通常會由當年TOP500排行名列前茅的計算機系統(tǒng)的應用獲得),說明應用水平提高還是很快的!
中國團隊獲得戈登貝爾獎
近五年來,中國占據(jù)了TOP500的榜首,原因之一是我們的發(fā)展道路(機器發(fā)展拉動應用需求),但是也有運氣成分,因為正好處在美日歐的低潮期。
在這五年里,美日歐的研制計劃都比較弱。日本國內對于要不要拿TOP500世界第一也有一些分歧,結果日本國會沒有撥款,所以日本的研發(fā)計劃一再拖延。歐盟是因為它本身沒有實力自己研制,只能購買美日等國的產(chǎn)品。美國是因為正好處在奧巴馬政府不重視的時期,預算被調整,本身的研制周期也出了問題。
所以我們找到個空檔,打了勝仗,這是難得遇到的歷史機遇。
超算TOP500中美國與中國的份額對比
中國的超算存在哪些問題?
我們也面臨很多的困擾,我們的機器發(fā)展比較快,但是相應的應用和軟件研制這塊有點滯后,沒有完全跟上,可能有投資原因,還有各種人才培養(yǎng)周期的原因。但是現(xiàn)在我們也在積極的解決這些問題,后期國家對軟件研發(fā)、對人才的培養(yǎng)都加大了投資力度。這些問題還需要5到10年的時間去解決,達到平衡狀態(tài)。
而比這次Summit拿下冠軍更值得關注的,我認為是新一代的百億億次競爭。
美國這次雖然拿了第一,但與中國的太湖之光所釆用的體系架構相比,并沒有本質的區(qū)別。太湖之光的峰值是125P,美國的Summit是187P,沒有量級上的性能差別。只是說由于Summit的投資力度大、研發(fā)時間晚,采用了新的工藝和技術,它的峰比太湖之光高一些,但是其在架構和技術上并沒有拉開差距。
現(xiàn)在全球的各個國家又重視超算了,都在重新調整戰(zhàn)略。新一代的百億億次競爭就會從2020年開始。到底哪個國家先做出來?
百億億次超級計算機的最大的問題就是功耗控制,需要在半導體工藝上有很大的突破,才有可能把功耗控制在30兆瓦左右。如果說功耗控制沒有發(fā)生革命性的降低,以現(xiàn)在的技術去搭建的話,它的功耗可能會達到一百兆瓦,就沒法用了。電費也太貴,1年的電費相當于十億人民幣。所以國際上的競爭就是看誰有本事在30兆瓦的功耗預算的前提下,能夠造出百億億次超級計算機,這個是目前最大的挑戰(zhàn)。
中美的超算競爭還將繼續(xù)。
中國超算何時可以重奪榜首之位?
美國重回超算排名榜首的新聞發(fā)布后,很快有消息說,別擔心,中國9月份就可以重回TOP500的榜首了。
這個絕對是謠言。中國至少在今年是不可能重回TOP500榜首的。美國會占據(jù)排行榜第一名的位置大概至少兩年的時間,蟬聯(lián)四次冠軍是有可能的。
至于在2020年有沒有可能?也許有可能。
我國的計劃應該是在2020年左右,憑借百億億次超級計算機重新去奪回世界第一的位置。但是能不能奪回來,也很難說,因為美國、日本、歐盟也在強化研制下一代的超級計算機,他們都是計劃在2021年左右推出,到底最后第一是誰還不一定。
-
計算機
+關注
關注
19文章
7636瀏覽量
90272 -
超級計算機
+關注
關注
2文章
471瀏覽量
42356 -
超算
+關注
關注
1文章
117瀏覽量
9319
原文標題:【超算較量】美國時隔六年重回榜首,中國超算如何前行
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
阿里最新消息:國家超算互聯(lián)網(wǎng)平臺、廣州算力中心、多所高校接入通義千問大模型
無錫太湖機床展倒計時!高端制造 筑夢之展

國家超算平臺推出AI生態(tài)加速計劃
超訊通信簽訂8.5億元智算集成服務大單

超算智算融合 南京信易達發(fā)布全新“智能算力融合平臺”

ETH-X超節(jié)點:開辟AI算力約束突破的新路徑

《算力芯片 高性能 CPUGPUNPU 微架構分析》第二篇閱讀心得:芯片拓撲學:并行擴展與CPU設計的巨頭對決
本源“量超融合先進計算平臺”入選2024算力中國·年度重大成果

澎峰科技受邀出席國家超算互聯(lián)網(wǎng)生態(tài)沙龍
ALINX出席AMD Partner Summit
硬件開發(fā)如何看待硬件開發(fā)的行業(yè)區(qū)別
預定下代超算第一?富士通144核Arm處理器公開

云數(shù)據(jù)中心、智算中心、超算中心,有何區(qū)別?

評論