在同構處理器時代,我們一般使用主頻來衡量一個處理器的性能。而到了異構處理器時代,隨著人工智能、大數據、多媒體編解碼對海量數據的計算需求,我們一般使用浮點運算能力來衡量一個處理器的性能。
每秒浮點運算次數(Floating Point Operations Per Second,FLOPS),又稱為每秒峰值速度。浮點運算在科研領域大量使用,現在的CPU除了支持整數運算,一般還支持浮點運算,有專門的浮點運算單元,FLOPS測量的就是處理器的浮點運算能力。FLOPS的計算公式如下:
浮點運算能力 = 處理器核數 * 每周期浮點運算次數 * 處理器主頻
除了FLOPS,還有MFLOPS、GFLOPS、TFLOPS、PFLOPS、EFLOPS等單位,它們之間的換算關系如下。
MFLOPS:megaFLOPS,每秒10^6次浮點運算,相當于每秒一百萬次浮點運算
GFLOPS:gigaFLOPS,每秒10^9次浮點運算,相當于每秒十億次浮點運算
TFLOPS:teraFLOPS,每秒10^12次浮點運算,相當于每秒一萬億次浮點運算
PFLOPS:petaFLOPS,每秒10^15次浮點運算,相當于每秒一千萬億次浮點運算
EFLOPS:exaFLOPS,每秒10^18次浮點運算,相當于每秒一百億億次浮點運算
1946年,世界上第一臺通用計算機誕生于美國賓夕法尼亞大學,運算速度為300FLOPS。早期樹莓派使用的博通CM2708 ARM11處理器,主頻為1GHz,運算速度為316.56MFLOPS。2011年發射的“好奇號”火星探測器,使用的是IBM的PowerPC架構的處理器,主頻為200MHz,運算速度相當于Intel 80386處理器的水平,差不多在0.4GFLOPS上下。
Intel的Core-i5-4210U處理器運算速度為36GFLOPS,Microsoft Xbox 360運算速度為240GFLOS,ARM Mali-T760 GPU主頻600MHz,運算速度為326GFLOPS,NVIDIA GeForce 840M運算速度為700GFLOPS,相當于0.7TFLOPS。
“吃雞游戲 ”絕地求生的標配顯卡NVIDIA Geforce GTX 1060運算速度為3.85TFLOPS,GTX 1080 Ti運算速度為11.5TFLOPS。最新的NVIDIA Tesla V100顯卡,運算速度為125TFLOPS,是世界上第一個突破100萬億次的深度學習GPU。
2008年,中國第一臺闖入世界前10的超級計算機:中國“曙光”5000A超級計算機,計算速度為230TFLOPS,相當于0.23PFLOPS。我國首臺千萬億次的超級計算機“天河一號”運算速度為2.566PFLOPS,美國橡樹嶺國家實驗室的“泰坦”超級計算機算力為17.59PFLOPS,“天河二號”的運算速度為33.86PFLOPS,無錫“神威·太湖之光”的運算速度為93.01PFLOPS,霸占超級計算機榜首多年。2019年11月18日發布的排在第一的是IBM設計的Summit超級計算機,運算速度為154.5PFLOPS,即0.1545EFLOPS。2020年11月最新發布的超級計算機排行榜發布,Summit被日本的Fugaku富岳反超,富岳超級計算機是首次采用全ARM架構的超級計算機,其中包含了7,299,072個core,算力為442PFLOPS,相當于0.442EFLOPS,算力差不多是summit的三倍。
2013年比特幣的全網算力為1EFLOPS,2018年5月,比特幣的全網算力為35EFLOPS。2020年5月,比特幣的全網算力峰值高達70EFLOPS以上,隨著比特幣價格的上下波動,比特幣的全網挖礦算力也隨之上下起伏。
Google公司在2017年發布的TPU v2處理器運算能力達到了180 TFLOPS,2019年發布的TPU v3版本,算力是420 TFLOPS。華為2018年發布的昇騰910 AI處理器,CPU算力達到640 TOPS@INT8,浮點運算能力為320 TFLOPS@FP16。這些都是服務器端的CPU算力,不用考慮功耗,所以算力都很高。
為了對比一下算力差距,將單位統一到 GFLOPS 后的數據如下:
-
處理器
+關注
關注
68文章
19812瀏覽量
233610 -
人工智能
+關注
關注
1804文章
48734瀏覽量
246651 -
大數據
+關注
關注
64文章
8952瀏覽量
139522
發布評論請先 登錄
名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
進迭時空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

評論