在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

?為什么GPU性能效率比峰值性能更關(guān)鍵

穎脈Imgtec ? 2025-03-13 08:34 ? 次閱讀

在評估 GPU 性能時,通常首先考察三個指標:圖形工作負載的紋理率(GPixel/s)、浮點運算次數(shù)(FLOPS)以及它們能處理計算和AI工作負載的每秒 8-bit tera 運算次數(shù)(TOPS)。這些關(guān)鍵數(shù)據(jù),結(jié)合面積數(shù)據(jù)、功耗估算和通用功能集,幫助 SoC 設(shè)計師比較不同系統(tǒng)配置的性能。

然而,這些指標僅提供了理論性能,并不總是能夠很好地反映實際性能。沒有任何 GPU 能夠始終以100%的利用率運行,因此下一步是探索GPU在實際應(yīng)用中的特定工作負載性能,通常以每秒幀數(shù)(FPS)來衡量,并考慮整體GPU利用率。像Manhattan和Aztec這樣的基準測試為實際圖形性能提供了一個有用的指南(盡管它們本身并不能完全代表典型的應(yīng)用程序)。

通常在這個階段,不同的GPU架構(gòu)會產(chǎn)生令人驚訝的結(jié)果。那些更擅長將理論性能轉(zhuǎn)化為實際性能的架構(gòu)會脫穎而出,提供遠高于其標稱TFLOPS預(yù)期的幀率(FPS)。


為什么FPS/TFLOPS很重要?通常來說,具有更高TFLOPS的GPU需要更大的硅片面積和更高的功耗。如果一個較小的GPU能夠提供與理論上更強大的GPU相同的實際性能,設(shè)計師就需要選擇:要么以更低的成本提供相同的性能,要么保持成本不變但將額外的性能或效率交給最終用戶。基于此,理解GPU的性能效率是了解GPU在終端設(shè)備中表現(xiàn)的重要部分。Imagination 的 PowerVR 架構(gòu)經(jīng)過數(shù)十年的優(yōu)化,已成為市場上性能最為高效的嵌入式 GPU IP。本文將概述關(guān)鍵的硬件和軟件優(yōu)化,幫助 Imagination 的 GPU 實現(xiàn)比競爭對手的嵌入式產(chǎn)品高出兩倍的 FPS/TFLOPS 性能。

e1a5743e-ffa2-11ef-9434-92fbcf53809c.png

1. 大容量、響應(yīng)迅速的寄存器存儲

Imagination GPU 的每個算術(shù)邏輯單元(ALU)內(nèi)都有非常大的寄存器存儲,一般為 512KB,通常是競爭對手嵌入式 GPU 設(shè)計的兩倍。這使得工作負載可以避免從主GPU內(nèi)存進行長時間的加載/存儲操作,這些操作可能會延遲處理工作,從而對GPU利用率和效率產(chǎn)生負面影響。ALU中的寄存器體設(shè)計得允許同時訪問多個寄存器。這意味著在每個周期中,ALU內(nèi)的多個單元都可以執(zhí)行任務(wù)。例如,F(xiàn)P32操作可以與復(fù)雜操作并行處理,而無需排隊等待內(nèi)存訪問。大多數(shù)其他嵌入式GPU架構(gòu)在寄存器訪問方面存在限制,這會導(dǎo)致數(shù)據(jù)需要額外的周期來獲取,從而造成處理停滯。

Imagination GPU設(shè)計可同時處理多個工作負載。這意味著當需要進行加載/存儲時,可以通過替代操作填補處理暫停,從而有效避免延遲問題。

2.專用模塊卸載主ALU工作

Imagination 的ALU包含多個固定功能塊,使 GPU 能夠?qū)⑷唛L的任務(wù)(如地址計算)從主ALU 卸載,從而使它們可以自由處理一般工作負載。相比之下,大多數(shù)其他嵌入式 GPU 提供商通過 INT32 ALU模擬地址計算和復(fù)雜任務(wù),降低了整體 GPU 性能效率。

3. 整體 GPU 架構(gòu)效率

由于其延遲渲染技術(shù),PowerVR架構(gòu)自問世以來一直是GPU效率的領(lǐng)導(dǎo)者。在流水線的早期階段,Imagination GPU 會全面分析每一幀,確定哪些片段是可見的,并僅處理用戶可以看到的部分。通過盡早移除不必要的操作,Imagination GPU降低了功耗并提高了性能效率。其他嵌入式GPU架構(gòu)仍然處理比必要更多的片段,浪費寶貴的計算資源和帶寬,從而需要更多功耗。

4. 軟件最大化GPU利用率雖然我們主要從圖形角度討論性能效率,但上述內(nèi)容同樣適用于計算和 AI 應(yīng)用。為了進一步提高 AI 工作負載的性能效率,Imagination 提供了一套高度優(yōu)化的計算庫(imgNN、imgBLAS、imgFFT),用于常見的運算操作,使程序員能夠最大化 GPU 利用率。

所有這些特性的結(jié)果不言而喻。在下圖的所有圖形工作負載中,Imagination GPU 的 FPS/TFLOPS超過了同等面積的嵌入式競爭對手設(shè)計。在某些情況下,性能效率是其他GPU的兩倍。

e1bc72c4-ffa2-11ef-9434-92fbcf53809c.png

圖注:基于Imagination內(nèi)部數(shù)據(jù)。所有競爭設(shè)備以低時鐘頻率運行,以避免主機 CPU 和系統(tǒng)瓶頸,以便更純粹地了解競爭 GPU 的能力。
GPU性能在所有細分市場上都在蓬勃發(fā)展,不僅用于圖形體驗,在 AI 時代,還將其用作靈活的并行計算處理器。硬件設(shè)計師有兩種選擇來提供這種額外的性能:一種是簡單地構(gòu)建一個具有更高理論TFLOPS的GPU;另一種選擇是選擇一個理論TFLOPS較低但高性能效率的 GPU。

聲明:本文為原創(chuàng)文章,轉(zhuǎn)載需注明作者、出處及原文鏈接。

原文鏈接:https://blog.imaginationtech.com/why-gpu-performance-efficiency-beats-peak-performance

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5143

    文章

    19562

    瀏覽量

    315487
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4917

    瀏覽量

    130745
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA下一代7nm GPU效率Turing高兩倍

    為Ampere的Turing GPU架構(gòu)的繼任者將是圖形行業(yè)的一項重大交易,它將在總體性能效率上實現(xiàn)預(yù)期更大的性能飛躍。該報告再次指出A
    的頭像 發(fā)表于 01-06 01:56 ?5347次閱讀

    優(yōu)化任何GPU工作負載的峰值性能分析方法

    弄清楚如何在個人電腦上降低渲染應(yīng)用程序的GPU幀時間可能是一項具有挑戰(zhàn)性的任務(wù),即使是最有經(jīng)驗的PC游戲開發(fā)人員也是如此。 本博客文章描述了我們在NVIDIA內(nèi)部使用的性能分類方法,使用NVIDIA
    的頭像 發(fā)表于 05-07 10:10 ?1.8w次閱讀
    優(yōu)化任何<b class='flag-5'>GPU</b>工作負載的<b class='flag-5'>峰值</b><b class='flag-5'>性能</b>分析方法

    NVIDIA火熱招聘GPU性能計算架構(gòu)師

    這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU性能計算架構(gòu)師(功能驗證)的崗位,有意向的朋友歡迎發(fā)送簡歷到 allelin@nvidia.comWechat
    發(fā)表于 09-01 17:22

    無人機螺旋槳效率的高速電機性能

    針對螺旋槳效率的高速電機性能:用于無人機電子速度控制的無傳感器高速磁場定向控制參考設(shè)計可以幫助電子速度控制器實現(xiàn)效率上的飛躍,使其速度超過12,000 rpm(>1.2kHz),并且還具
    發(fā)表于 06-26 09:47

    GPU加速XenApp/Windows 2016/Office/IE性能會提高嗎

    配置文件來了解3D / GPU / HDX性能。 XenApp服務(wù)器運行的是帶有4個vCPU和48GB RAM的Windows Server 2016映像。在性能測試期間,我一直在使用GPU
    發(fā)表于 09-12 16:24

    如何在vGPU環(huán)境中優(yōu)化GPU性能

    大家好,我收到了關(guān)于如何在vGPU環(huán)境中優(yōu)化GPU性能的兩個請求,并認為這將是我們的GRID論壇上的一個很好的線程,每個人都可以在他們?nèi)绾挝⒄{(diào)vGPU環(huán)境方面添加他們的經(jīng)驗。讓我從一些公共資源開始
    發(fā)表于 09-29 14:18

    如何估算FPGA的峰值性能

    嗨,作為博士研究的一部分,我試圖估算FPGA的峰值性能,以便與GPU進行比較。我的計算基于Xilinx共同撰寫的這篇文章https://www.hpcwire.com/2012/04/16
    發(fā)表于 08-13 09:56

    探求NVIDIA GPU極限性能的利器

    1、探求 NVIDIA GPU 極限性能的利器  在通常的 CUDA 編程中,用戶主要通過 CUDA C/C++ 或 python 語言實現(xiàn) CUDA 功能的調(diào)用。在 NVIDIA 對 CUDA C
    發(fā)表于 10-11 14:35

    如何使用iMX8mmini提高GPU性能

    我正在使用 iMX8mmini 并嘗試提高 GPU 性能。使用下面的命令我發(fā)現(xiàn)當前 GPU 以 500 MHz 的頻率運行。根據(jù)數(shù)據(jù)表或設(shè)備樹節(jié)點,GPU 以 800 MHz 的標稱頻
    發(fā)表于 04-18 07:17

    Mali GPU性能分析工具

    本文檔描述了馬里GPU性能分析工具2.2版中的已知勘誤表。 這是一個貫穿整個產(chǎn)品生命周期的工作文檔,因此,隨著新信息的發(fā)現(xiàn),其內(nèi)容可能會被修改。 本文中包含的信息是ARM有限公司的財產(chǎn),對錯誤或遺漏
    發(fā)表于 09-05 07:08

    Imagination 和臺積電攜手,共同提升業(yè)界領(lǐng)先的 GPU 性能

    的 PowerVR GPU 達到下一代性能的新境界。雙方初期的合作已為 PowerVR Series6 GPU 內(nèi)核提升了 25% 的整體性能,其中部分
    發(fā)表于 09-11 15:10 ?501次閱讀

    英特爾深度學(xué)習(xí)芯片Lake CrestGPU性能更強大

    近日,Intel展示了旗下用于深度神經(jīng)網(wǎng)絡(luò)計算(Deep Neural Network,DNN)的Lake Crest家族新芯的進展,基于Nervana平臺打造,宣稱可以在同樣晶體管密度的情況下提供GPU更強大的性能
    發(fā)表于 02-06 17:16 ?1304次閱讀

    關(guān)于“GPU性能的硅前預(yù)測”的5個問題

    人們都很認可“GPU性能非常關(guān)鍵”這一觀點。從2011年到2022年,GPU單卡算力提高了10倍以上,而GDDR/HBM帶寬提高大約2倍以上。對于國產(chǎn)
    發(fā)表于 09-29 10:30 ?1453次閱讀

    GPU性能服務(wù)器配置

    GPU性能服務(wù)器作為提升計算速度和效率關(guān)鍵設(shè)備,在各大應(yīng)用場景中發(fā)揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU
    的頭像 發(fā)表于 10-21 10:42 ?772次閱讀

    如何提高GPU性能

    在當今這個視覺至上的時代,GPU(圖形處理單元)的性能對于游戲玩家、圖形設(shè)計師、視頻編輯者以及任何需要進行高強度圖形處理的用戶來說至關(guān)重要。GPU不僅是游戲和多媒體應(yīng)用的心臟,它還在科學(xué)計算、深度
    的頭像 發(fā)表于 10-27 11:21 ?2226次閱讀
    主站蜘蛛池模板: 农村的毛片丨级 | 丁香天堂网 | 日韩精品一级毛片 | 免费又爽又黄1000禁片 | 黄a在线 | 男女全黄做爰视频 | 一级特黄aaa大片在线观看 | 成人综合激情 | 瑟瑟网站免费 | 久久久国产精品免费 | 福利视频一区二区三区 | 欧美系列在线观看 | 手机看片1024日韩 | 第四色男人天堂 | 狠狠狠色丁香婷婷综合久久88 | 1024你懂的国产日韩欧美 | 久久人人做人人玩人精品 | 欧美一级乱理片免费观看 | 天天成人 | 永久在线观看视频 | 亚洲欧美4444kkkk | 色老头网址 | 韩国床戏合集三小时hd中字 | 最新版资源在线天堂 | 天天天天天天天操 | 日本内谢69xxxx免费 | 一个人看的www片免费高清视频 | www一级毛片| 68日本 xxxxxxxxx| 毛片网站网址 | 全国男人的天堂网站 | 久久人人做人人玩人精品 | 久久久久88色偷偷 | 国卡一卡二卡三免费网站 | 美女写真福利视频 | 偷偷狠狠的日日日日 | 在线免费观看91 | 黄色网页在线观看 | 中日韩精品视频在线观看 | 免费拍拍视频 | 在线成人 |