在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Exaflop簡史

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-08-03 09:54 ? 次閱讀

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可至少進行百億億次浮點運算。

為了解決這個時代最復雜的問題,比如如何治療像新冠肺炎和癌癥這樣的疾病、以及如何緩解氣候變化等。計算機的計算量正在不斷增加。

所有這些重大挑戰將計算帶入了現今的百億億次級時代,頂級性能通常以 exaflops 來衡量。

什么是 Exaflop?

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可以至少進行 10^18 或百億億次浮點運算。

Exaflop 中的 exa-前綴表示“百億億”,即 10 億乘以 10 億或1的后面有 18 個零。同樣,單個 exabyte 的內存子系統可以儲存百億億字節的數據。

exaflop 中的“flop”是浮點運算的縮寫。exaflop/s 是表示系統每秒浮點運算次數的單位。

浮點是指所有數字都用小數點表示的計算方法。

1000 Petaflop = 1 Exaflop

前綴 peta- 表示 10^15,即 1 的后面有 15 個零。因此 1 exaflop 等于 1000 petaflop。

c4a277d0-1263-11ed-ba43-dac502259ad0.png

1 exaflop 的計算量到底有多大?相當于十億人中的每個人都拿著十億個計算器。

如果他們同時按下等號,就是進行了 1 個 exaflop。

擁有 Big Red 200 和其他幾臺超級計算機的印第安納大學表示,exaflop 計算機的速度相當于一個人每秒鐘進行一次計算,并一直計算 31,688,765,000 年。

Exaflop 簡史

在超級計算發展史的大部分時間里,一次浮點運算就是一次,但隨著工作負載引入 AI ,這種情況也發生了變化。

人們開始使用最高的精度格式來表示數字,這種格式被稱為雙精度,由 IEEE 浮點運算標準定義。它之所以被稱為雙精度或 FP64,是因為計算中的每個數字都需要以 64 位用 0 或 1 表示的數據塊表示,而單精度為 32 位。

雙精度使用 64 位確保每個數字都精確到很細微的部分,比如 1.0001 + 1.0001 = 2.0002,而不是 1 + 1 = 2。

這種格式非常適合當時的大部分工作負載,比如從原子到飛機等全部需要確保模擬結果接近于真實的模擬。

因此,當 1993 年全球最強大的超級計算機榜單 TOP500 首次發布時,衡量 FP64 數學性能的 LINPACK 基準(又稱HPL)自然成為了默認的衡量標準。

AI 大爆炸

十年前,計算行業發生了 NVIDIA 首席執行官黃仁勛所說的 AI 大爆炸。

這種強大的新計算形式開始在科學和商業應用上展現出重大成果,而且它運用了一些非常不同的數學方法。

深度學習并不是模擬真實世界中的物體,而是在堆積如山的數據中篩選,以找到能夠帶來新洞察的模式。

這種數學方法需要很高的吞吐量,所以用經過簡化的數字(比如使用 1.01 而不是 1.0001)進行大量計算要比用更復雜的數字進行少量計算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式,通過 32 位、16 位和 8 位數讓用戶更快地進行更多計算。

混合精度不斷發展

AI 使用 64 位數就如同在周末外出時帶著整個衣柜。

研究人員一直在積極地為 AI 尋找理想的低精度技術。

例如首個 NVIDIA Tensor Core GPU——Volta,它使用了混合精度,并以 FP16 格式執行矩陣乘法,然后用 FP32 累積結果以獲得更高的精度。

Hopper 通過 FP8 加速

最近,NVIDIA Hopper 架構首次發布了速度更快的低精度 AI 訓練方法。Hopper Transformer Engine 能夠自動分析工作負載,盡可能采用 FP8 并以 FP32 累積結果。

在進行計算密集度較低的推理工作,比如在生產中運行 AI 模型時,TensorFlow 和 PyTorch 等主要框架通過支持 8 位整數實現快速性能,因為這樣就不需要使用小數點來完成工作。

好消息是,NVIDIA GPU 支持上述所有精度格式,因此用戶可以實現每個工作負載的最優加速。

去年,IEEE P3109 委員會開始為機器學習中使用的精度格式制定行業標準。這項工作可能還需要一到兩年的時間才能完成。

一些模擬軟件在低精度工作中大放異彩

雖然 FP64 在模擬工作中仍然很受歡迎,但當低精度數學能夠更快提供可用結果時,許多人會使用后者。

c4d88d16-1263-11ed-ba43-dac502259ad0.png

影響 HPC 應用程序性能的因素各不相同

例如,研究人員用 FP32 運行廣受歡迎的汽車碰撞模擬器——Ansys LS-Dyna。基因組學也傾向于使用低精度數學。

此外,許多傳統的模擬開始在部分工作流程中采用 AI。隨著越來越多的工作負載使用 AI,超級計算機需要支持較低的精度才能有效運行這些新興應用。

基準與工作負載同步發展

在認識到這些變化后,包括 Jack Dongarra(2021 年圖靈獎得主和 HPL 的貢獻者)在內的研究人員在 2019 年首次發布了 HPL-AI,這項新基準更適合測量新的工作負載。

Dongarra 在 2019 年的博客中表示:“無論是技術不斷優化的傳統模擬,還是 AI 應用,混合精度技術對于提高超級計算機的計算效率越來越重要。正如 HPL 實現了對雙精度能力的基準測試一樣,這種基于 HPL 的新方法可以對超級計算機的混合精度能力進行大規模基準測試。”

尤利希超級計算中心主任 Thomas Lippert 同意了這一觀點。

他在去年發表的一篇博客中表示:“我們使用 HPL-AI 基準是因為它既能夠準確地衡量日益增加的 AI 和科學工作負載中的混合精度工作,也能反映準確的 64 位浮點計算結果。”

現今的 Exaflop 系統

在 6 月的一份報告中,全球 20 個超級計算機中心提交了 HPL-AI 結果,其中有三個中心提供了超過 1 exaflop 的性能。

在這些系統中,橡樹嶺國家實驗室的超級計算機在 HPL 上的 FP64 性能也超過了 1 exaflop。

c517a064-1263-11ed-ba43-dac502259ad0.png

2022 年 6 月 HPL-AI 結果的采樣器

兩年前,一非傳統系統首次達到 1 exaflop。這臺由 Folding@home 聯盟組裝的眾源超級計算機在呼吁幫助抵御新冠疫情后,達到了這一里程碑,到現在已有超過 100 萬臺計算機加入其中。

理論和實踐中的Exaflop

許多組織從那時起就已開始安裝理論峰值性能超過 1 exaflop 的超級計算機。需要注意的是,TOP500 榜單同時發布 Rmax(實際)和 Rpeak(理論)分數。

Rmax 指計算機實際表現出的最佳性能。

Rpeak 是一切系統都處于高水平運行時的最高理論性能,而這幾乎從未發生過。該數值的計算方法通常是將系統中的處理器數量乘以其時鐘速度,然后再將結果乘以處理器在一秒鐘內可執行的浮點運算數。

因此,如果有人說他們的系統達到 1 exaflop,請詢問他說的是 Rmax(實際)還是Rpeak(理論)。

Exaflop 時代的眾多指標

這也是新百億億次時代的眾多細微變化之一。

值得注意的是,HPL 和 HPL-AI 屬于合成基準,即它們衡量的是數學程序的性能,而不是真實世界的應用。MLPerf 等其他基準則基于真實世界中的工作負載。

最后,衡量系統性能的最佳標準當然是它運行用戶應用程序的情況。該衡量標準不是基于 exaflop,而是基于投資回報率。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5258

    瀏覽量

    105858
  • 計算機
    +關注

    關注

    19

    文章

    7636

    瀏覽量

    90268
  • AI
    AI
    +關注

    關注

    88

    文章

    34421

    瀏覽量

    275710

原文標題:什么是 Exaflop?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    中國傳感器市場規模突破4000億!工信部產業研究院最新數據出爐

    ? ? 近期,工信部直屬產業研究機構賽迪研究院,發布最新的中國傳感器產業市場數據,較具有參考性。本文僅做相關核心數據分享,報告原文請于賽迪顧問官網獲取。 ? 據賽迪顧問報告顯示,2024年中國傳感器市場規模首次超過4000億元——達4061.2億元,同比增長11.4%。賽迪顧問預計,到2027年,中國傳感器市場規模有望達到5793.4億元。 ? 具體到各傳感器細分領域,在2024年中國傳感器市場細分份額中,壓力傳感器以714.2億元的規模排名第一,占比17.6%;流
    的頭像 發表于 06-14 17:37 ?21次閱讀
    中國傳感器市場規模突破4000億!工信部產業研究院最新數據出爐

    奧托立夫亮相2025軒轅汽車藍皮書論壇

    2025年6月13日—15日,備受矚目的2025第十七屆軒轅汽車藍皮書論壇(China Auto Blue-Book Forum,簡稱CABF)在廣州白云國際會議中心越秀萬豪酒店·會議中心隆重召開,作為汽車行業的領軍企業,奧托立夫中國區銷售、工程、戰略及業務發展副總裁毛莉莉受邀出席了此次盛會并參與圓桌論壇,與逾百名行業精英共繪行業未來新圖景。
    的頭像 發表于 06-14 17:36 ?44次閱讀

    PCBA代工代料行業怎么應用AI技術?這五大變革不可不知

    ——從“制造”到“智造”,AI如何賦能電子制造的“心臟”? 在電子制造領域,PCBA(印刷電路板組裝)被稱為電子產品的“心臟”,而代工代料模式則是這一行業高效運轉的核心。隨著AI技術的快速滲透,傳統PCBA行業正經歷一場從“經驗驅動”到“數據驅動”的智能化革命。本文將深入探討AI技術如何推動這一領域的五大核心變革。 ? 一、生產流程智能化:效率與精度的雙重飛躍 AI質檢:告別“人眼找芝麻”的時代 傳統PCBA檢測依賴人工目檢,效率低
    的頭像 發表于 06-14 17:35 ?21次閱讀
    PCBA代工代料行業怎么應用AI技術?這五大變革不可不知

    programmer下載常見問題總結-v11

    一、通過命令行燒寫 參考文檔Efinity Programmer User Guide部分,內容如下: 具體操作如下: Efinity版本?:2024.2 安裝路徑:?C:Efinity2024.2 Hex文件路徑:?E:FPGA_Demo1_Ti181j484pgm_test (1)打開cmd (2)把路徑轉到C:Efinity2024.2bin,并運行setup.bat (3)把路徑轉換到hex存儲的目錄 (4)先配置jtag_bridge文件,指令如下【注意fitd_program.py在.pgabinefx_pgm路徑下】: C:efinity2024.2binpython3 C:efinity2024.2pgmbinefx_pgmftdi_program.py -m jtag C:Efinity2024.2pgmflititaniumu00690A79.bit 其中bridge文件的路徑在programm
    的頭像 發表于 06-14 17:34 ?41次閱讀
    programmer下載常見問題總結-v11

    如何防止電機驅動系統中的電源故障

    電機驅動系統作為工業自動化、電動汽車、家用電器等領域的核心部件,其電源穩定性直接關系到設備的安全運行和壽命。電源故障可能導致電機失控、設備損壞甚至安全事故。因此,如何有效預防和應對電機驅動系統中的電源故障,成為工程師和用戶關注的焦點。以下是針對電源故障的成因分析及系統性解決方案。 一、電源故障的主要類型及成因 1. 電壓波動與突降 ● 成因:電網負載突變(如大功率設備啟停)、線路阻抗過高或供電容量不足。 ● 影
    的頭像 發表于 06-14 17:33 ?30次閱讀
    如何防止電機驅動系統中的電源故障

    匯川技術榮獲CQC構網型儲能變流器認證證書

    近日,在SNEC第十八屆上海國際光伏儲能展上,匯川技術1250kW儲能變流器榮獲中國質量認證中心(以下簡稱CQC)頒發的構網型儲能變流器認證證書。這一權威認證的取得,標志著匯川技術在儲能構網領域實現重大突破,正式躋身全球智能電網技術前沿陣營。
    的頭像 發表于 06-14 17:33 ?56次閱讀

    《電子發燒友電子設計周報》聚焦硬科技領域核心價值 第13期:2025.05.26--2025.05.30

    標準簡史; IEEE Std 802.3df 和 IEEE P802.3dj 標準的更新; 助力下一代超大規模數據中心; 3、前沿技術公開課--知存科技+知名高校教授打造存內計算系列課程 (值得
    發表于 05-30 19:39

    機器人和自動化的未來(1)

    時代的到來,不僅標志著技術的飛躍,也預示著社會結構和生活方式的巨大變革。1.1機器人簡史:從幻想到現實談到機器人,人們很容易
    的頭像 發表于 04-19 08:34 ?234次閱讀
    機器人和自動化的未來(1)

    五金清洗機的簡史與未來發展趨勢解析

    想象一下,身處在繁忙的工業車間里,金屬零件堆積如山,等待著清洗。你或許會問:“這些金屬零件如何才能恢復到如新般的光澤?”這就要提到五金清洗機的神奇之處。它不僅能高效清潔,還象征著工業發展的智能化與自動化。今天,讓我們一起走進五金清洗機的歷史長河,探索它的演變、技術進步以及未來的發展趨勢。五金清洗機的誕生背景和歷史沿革五金清洗機并非一夕之間的產物,它的誕生與工
    的頭像 發表于 04-10 16:33 ?389次閱讀
    五金清洗機的<b class='flag-5'>簡史</b>與未來發展趨勢解析

    AI先鋒對話:DeepSeek爆火背后,戰略破局的新思考

    近日,阿丘科技聯合創始人鄭慧偉受邀參加由慎思行舉辦的《戰略簡史》老友會,與慎思行老羅、云南白藥戰略負責人顧嘉,一起探討AI將如何影響未來戰略這一時代命題。本次討論主要圍繞“DeepSeek火爆背后
    的頭像 發表于 02-27 15:11 ?597次閱讀
    AI先鋒對話:DeepSeek爆火背后,戰略破局的新思考

    英飛凌IGBT7系列芯片大解析

    上回書(英飛凌芯片簡史)說到,IGBT自面世以來,歷經數代技術更迭,標志性的技術包括平面柵+NPT結構的IGBT2,溝槽柵+場截止結構的IGBT3和IGBT4,表面覆銅及銅綁定線的IGBT5等。現今
    的頭像 發表于 01-15 18:05 ?1004次閱讀
    英飛凌IGBT7系列芯片大解析

    安森美(onsemi)的超聲波傳感器解決方案的未來趨勢和創新

    簡要介紹超聲波傳感器的發展歷程,并結合當前和未來的應用,預測未來幾年超聲波傳感器的應用領域。? ? ? 汽車超聲波傳感器簡史 超聲波技術常用于檢測物體和發現固體材料中的缺陷,其首項專利可以追溯到上世紀30年代。一直
    的頭像 發表于 11-23 14:53 ?1649次閱讀

    名單公布!【書籍評測活動NO.50】親歷芯片產線,輕松圖解芯片制造,揭秘芯片工廠的秘密

    的知識門檻低,又獨家揭秘了芯片制造工廠的運營到管理,適用于更大讀者群。本書非常適合對芯片這個話題(不管是技術還是產業運營等)感興趣的IC從業者和大眾讀者。 相信閱讀過《芯路》《半導體簡史》《圖解
    發表于 11-04 15:38

    【「ARM MCU嵌入式開發 | 基于國產GD32F10x芯片」閱讀體驗】+書籍整體概況

    系統的概念,ARM簡史,以及前期的準備工作,視頻時長112min。 第二章介紹GD32F10x的架構,包含計算機架構,Cortex-M3架構;第三章通用輸入/輸出端口GPIO介紹,內容非常豐富,介紹
    發表于 08-25 22:48

    Perforce靜態代碼分析專家解讀MISRA C++:2023?新標準:如何安全、高效地使用基于范圍的for循環,防范未定義行

    Frank van den Beuken博士的博客系列,本期為第三篇。 在前兩篇系列文章中,我們向您介紹了 新的MISRA C++ 標準 和 C++簡史 。本文,我們將仔細研究C++中以for循環為中心
    的頭像 發表于 06-18 12:57 ?707次閱讀
    主站蜘蛛池模板: 国产精品久久久久久久牛牛 | 午夜国产精品久久影院 | 性日韩精品 | free性欧美高清另类 | 你懂得在线网址 | 国产美女在线精品观看 | 在线高清国产 | 四虎影视永久在线精品免费播放 | 色激情五月 | 国产在视频线精品视频2021 | 午夜免费理论片在线看 | 色福利网 | 五月天婷婷网亚洲综合在线 | 日韩卡1卡2卡三卡四卡二卡免 | 婷婷sese| 在线免费午夜视频 | 蜜色网| 一级 黄 色 片免费 一级@片 | 色播丁香| 天天做.天天爱.天天综合网 | 在线小毛片| 国内外精品免费视频 | 天堂网在线.www天堂在线 | 四虎最新永久在线精品免费 | 免费视频观看 | 伊人网综合视频 | 91寡妇天天综合久久影院 | 在线天堂中文在线网 | 国产91色综合久久免费分享 | 激情五月亚洲色图 | 欧美成人三级伦在线观看 | 2021色噜噜狠狠综曰曰曰 | 好黄好猛好爽好痛的视频 | 国产精品久久精品福利网站 | 色噜噜狠狠色综合欧洲selulu | 亚洲精品老司机综合影院 | 欧美夜夜夜 | 亚洲色图 欧美 | 操日韩美女| 四虎永久影院永久影库 | 久久成人性色生活片 |