在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Summit系統創造性能新記錄,突破了每秒100千萬億的次浮點運算!

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 作者:工程師黃明星 ? 2018-07-23 17:28 ? 次閱讀

近日,橡樹嶺國家實驗室的Summit系統呈獻了又一場超級計算盛宴,創造了又一項性能記錄,該系統首次突破了每秒100千萬億次浮點運算性能的壁壘。

最新發布的Top500榜單中,大部分系統的新處理能力均來自GPU。目前世界七大超級計算機中有五款都在采用GPU,包括美國、歐洲和日本的頂尖系統。

而對于Summit,GPU滿足了其95%的浮點運算性能要求。隨著摩爾定律的不斷放緩,加速計算顯然已經成為助推器,將很快推動我們進入百億億次級計算時代。

Summit系統創造性能新記錄,突破了每秒100千萬億的次浮點運算!

這樣的計算性能由NVIDIA Volta Tensor Core GPU提供,其多精度計算能力將能同時應對高性能計算所需的高精度計算挑戰,以及深度學習所需的高效處理的要求。

加速計算登峰造極

每年兩次的超級計算展見證了加速計算近年來的飛速發展。在ISC 2018上,這一領域再次實現了突破。

Summit顯然是最有力的證據。該系統采用27648塊Volta Tensor Core GPU,其測得的雙精度性能達到每秒122千萬億次浮點運算。它每秒的性能相當于地球上所有人以每秒執行一次計算的速度執行一整年的任務。

AI性能更加令人矚目,運算速度可達到300億億次。這相當于整個地球上的人在15年內每秒進行一次計算。

至省與至簡

多精度計算開辟了新的可能性。但是,如果GPU無法提供非凡的效率,相應的效用將受限。

在最新的Green500榜單,GPU為全球20個最具環保效益的系統中的17個提供支持。Summit不僅是世界上速度最快的系統,而且在新確立的“三級”類別(Green500 榜單中最嚴格的級別)中是世界上最高效的系統。

在過去10年中,GPU已經幫助美國橡樹嶺國家實驗室將其超級計算機的能源效率提高了50倍,這些計算機包括僅支持CPU的Jaguar及由GPU加速的Titan和Summit。

而所有這些僅僅是一個開始。實現百億億次級計算需要在能源效率方面實現更大突破。以Green500榜單中系統的平均效率計算,為百億億次級計算提供動力將需要超過3億瓦的電能,這相當于25萬個美國家庭的電力需求。需要將能效提高10倍才能使百億億次級計算在3千萬瓦條件下運行。

GPU正在幫助Summit實現這一目標。

破解難題

最新頂尖系統具備的處理能力曾經令人無法想象,但現在的研究人員將能夠借助這些系統解決一些科學上最棘手的難題。

比如,遺傳學。帕金森癥和阿爾茨海默癥等可以稱得上是“毀滅性”疾病,而GPU的計算能力將可以破解這樣的難題,找出人類基因組的數十億個AGCT DNA對與諸如此類疾病之間的聯系。Summit已在梳理個人基因,以實現在阿片成癮(美國人的主要致死原因之一)研究方面的進展。

又如,材料。超導材料可用于為MRI設備、粒子加速器或磁聚變裝置開發功能強大的科學磁體。然而,目前的材料十分易碎、難以制造,并且只能在非常低的溫度下工作。Summit正在幫助模擬和發現具有類金屬特性且可在室溫下工作的新型超導材料。

再如,癌癥研究。對抗癌癥的關鍵在于開發可以自動提取、分析和分類健康數據的工具,以便揭示各種疾病因素(例如基因、生物學標記和環境)之間隱藏的關系。通過與基于文本的報告和醫學影像等非結構化數據配合使用,在Summit上擴展的深度學習算法將有助于醫學研究人員全面了解美國癌癥患者的整體情況。

Summit系統創造性能新記錄,突破了每秒100千萬億的次浮點運算!

繼續前進

每個國家/地區都在競相構建百億億次級計算系統。2025年的Top500榜單可能會看到十多款這樣的系統,而且多精度加速計算成為平臺首選。相比之下,本次Top500榜單上的所有系統加在一起才勉強實現一百億億次級的總計算能力。這足以說明未來蘊藏著巨大機遇。

加速計算的一大吸引力在于它屬于全棧創新:從架構一直到系統、加速堆棧、開發人員和半導體工藝,無一不體現著創新精神。

NVIDIA已經投入了超過10年的時間來加速整個HPC堆棧的開發。

當我們發布第一款支持CUDA的GPU時,它無法運行任何應用程序。我們需要為全新的加速環境重新設計所有的應用程序、算法、庫、工具、編譯器、操作系統和系統設計。打造一種能夠處理數學處理器芯片很容易,而要使全球高性能計算開發人員可以使用和編程這些處理器,則需要在整個堆棧上實現非凡的創新。

結果,550多款高性能計算和AI應用程序都由GPU加速,其中包括排名靠前的15種應用程序和所有AI框架。致力于此領域的開發人員數量在過去的五年里增加了10倍,現已接近一百萬。而且,利用我們NGC容器注冊上的最新高性能計算容器,高性能計算用戶現在可以在他們的系統或Tensor Core GPU驅動的云上輕松點擊、下載并運行最新的GPU加速應用程序。

轉折與展望

在我們快速發展加速計算的同時,一些人也正在尋找量子計算的下一個轉折點,量子計算使用量子位元(“qubits”)而不是1和0來處理信息

這些理論十分具有吸引力。在未來的某個時候,可能會出現一些在量子計算機上運行的殺手級應用程序(特別是在密碼學或量子化學領域),只需極小的功率即可利用超強的處理能力。

但在可預見的未來,加速計算的勢頭似乎不可阻擋。NVIDIA會繼續致力于在高性能計算領域的創新,將實現百億億次級計算以及其為科學領域帶來的突破。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103728
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4777

    瀏覽量

    129360

原文標題:加速計算成為助推器,帶我們進入百億億次級計算時代

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【RA-Eco-RA4E2-64PIN-V1.0開發板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比

    , atan,等等基本操作。 當然為了測試出硬件浮點運算性能,這里很有必要在測試一下軟件浮點運算能力,方便做個測試對比,怎么做軟件
    發表于 12-30 17:55

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數點對齊等問題即可。在本文中,運用在前一節中描述的自定義浮點格式FPGA中數的表示方法(下),完成浮點四則運算的實現過程 1.自
    的頭像 發表于 11-16 12:51 ?381次閱讀
    FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA中浮點四則運算的實現過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數點對齊等問題即可。在本文中,運用在前一節中描述的自定義浮點格式FPGA中數的表示方法(下),完成浮點四則運算的實現過程 1.自
    的頭像 發表于 11-16 11:19 ?615次閱讀
    FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現過程

    Flash電池充電突破了充電電流的界限

    電子發燒友網站提供《Flash電池充電突破了充電電流的界限.pdf》資料免費下載
    發表于 10-15 11:27 ?0次下載
    Flash電池充電<b class='flag-5'>突破了</b>充電電流的界限

    解析OrangePi AIpro:什么是 TOPS,為什么它對?AI?PC很重要?

    )的處理器(CPU),以提升人工智能特定性能。TOPS是“TeraOperationsPerSecond”(每秒萬億運算)的縮寫,它表示
    的頭像 發表于 07-29 14:50 ?647次閱讀
    解析OrangePi AIpro:什么是 TOPS,為什么它對?AI?PC很重要?

    打破系統局限性:來自de next-TGU8-EZBOX的能量釋放

    在denext-TUG8創造性突破了板卡空間的局限后,現在denext-TUG8-EZBOX正在顛覆整個系統領域。作為denext系列中的首款系統級產品,denext-TUG8-EZ
    的頭像 發表于 07-13 08:06 ?152次閱讀
    打破<b class='flag-5'>系統</b>局限性:來自de next-TGU8-EZBOX的能量釋放

    突破光學成像極限:每秒處理數萬億幀圖像!

    。該研究小組位于國家科學研究中心的能源材料電信研究中心,他們開發了一種新型超快攝像系統每秒可捕捉高達156.3萬億
    的頭像 發表于 05-29 06:27 ?331次閱讀
    <b class='flag-5'>突破</b>光學成像極限:<b class='flag-5'>每秒</b>處理數<b class='flag-5'>萬億</b>幀圖像!

    【RISC-V人才行】走進國家超級計算深圳中心(深圳云計算中心)

    是科技部最早批復成立的兩家國家級超算中心之一,配置了世界Top級超級計算機系統運算速度達每秒千萬億,十余年來致力于支撐深圳市乃至全國基礎
    的頭像 發表于 05-13 17:44 ?609次閱讀
    【RISC-V人才行】走進國家超級計算深圳中心(深圳云計算中心)

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    千萬億浮點運算。 英偉達還構建了由72張GB200構成的DGX GB200 NVL72[超級計算機]。該超級計算機在內部節點間使用銅纜連接,以降低功耗。 Blackwell 圖形
    發表于 05-13 17:16

    優秀的Verilog/FPGA開源項目-浮點運算器(FPU)介紹

    浮點運算器(英文:floating point unit,簡稱FPU)是計算機系統的一部分,它是專門用來進行浮點運算的(CPU中也叫ALU
    的頭像 發表于 04-26 11:27 ?3868次閱讀
    優秀的Verilog/FPGA開源項目-<b class='flag-5'>浮點</b><b class='flag-5'>運算</b>器(FPU)介紹

    科學家研發超高幀率相機,每秒拍攝156.3萬億幀圖像

    通過獨特的計算成像模式,研究團隊成功地讓光線于不同時刻進入傳感器,使得相機能以驚人的每秒156.3萬億幀速度拍攝緩慢運動的畫面。
    的頭像 發表于 03-27 15:46 ?1092次閱讀

    verilog語音實現浮點運算

    Verilog可以通過使用IEEE標準的浮點數表示來實現浮點運算。下面是一個基本的Verilog模塊示例,展示了如何進行加法、乘法和除法等常見的浮點
    發表于 03-25 21:49

    Cerebras發布WSE-3 AI芯片,性能翻倍達4萬億晶體,能耗不變

    該款 WSE-3 AI芯片幾乎完全由一塊12英寸晶圓構成,形如邊長21.5厘米之正方體。這款芯片設有90萬個 AI 內核,理論上可輸出每秒125百億浮點運算(PFLOPS)的超強算力
    的頭像 發表于 03-18 16:37 ?1016次閱讀

    STSPIN32F0支持硬件浮點運算嗎?

    STSPIN32F0 支不支持硬件浮點運算
    發表于 03-13 06:32

    驍龍X Elite處理器在AI生成圖片性能超群,英特爾亦被超越

    高通公司稱,該款處理器內置AI協處理器(NPU),性能達到驚人的45 TOPS(每秒萬億運算)。視頻通過實例對比英特爾酷睿 Ultra 7
    的頭像 發表于 02-28 14:09 ?914次閱讀
    主站蜘蛛池模板: 禁漫羞羞入口 | 国产免费一区二区三区在线 | 在线免费观看色片 | 欧美一级特黄aa大片视频 | 亚洲一区有码 | 国产精品天天看大片特色视频 | 亚洲 欧美 另类 吹潮 | 四虎最新网 | 免费看大美女大黄大色 | 女bbbbxxxx视频 | 久久精品视频热 | 在线观看色视频网站 | 天堂tv亚洲tv日本tv欧美人tv | 欧美a视频| 精品免费久久久久久成人影院 | 手机看片a永久免费看大片 手机毛片 | 日韩亚洲欧洲在线com91tv | 日韩电影中文字幕 | 男女视频在线播放 | h视频欧美 | 免费欧美 | 高清视频一区二区三区 | 天天干天天操天天玩 | 网色视频 | 天天躁日日躁成人字幕aⅴ 天天躁夜夜躁 | 扒开双腿疯狂进出爽爽爽 | 天堂v网| 天天搞夜夜操 | 青青伊人91久久福利精品 | 日本韩国三级在线 | 天堂网2017| 天天爽夜夜爽一区二区三区 | 国内精品视频在线 | 99在线热播精品免费 | 色女人综合| 欧美爱爱帝国综合社区 | 婷婷丁香色 | 免费看h网站 | 免费视频不卡 | 美女一级牲交毛片视频 | 操美女视频网站 |