在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

移動GPU經典的Rogue架構淺析 人工智能的新戰場

SSDFans ? 2018-09-22 22:43 ? 次閱讀

隨著人工智能的飛速發展,和業界對人工智能項目落地的巨大需求,移動端GPU的競爭也日益激烈,除了來自各GPU廠商之間的競爭之外,也要與專用芯片展開競爭(例如寒武紀的NPU等),可謂群雄逐鹿。

在之前的一篇淺析移動端GPU的文章中介紹過移動端GPU領域主要的三家廠商。隨著蘋果棄用PowerVR,在手機領域Mali和Adreno有著絕對的優勢,而在物聯網自動駕駛領域,三家都并未建立起完整的生態。這兩個領域除了GPU,也有一些專用芯片廠商入局,隨著物聯網和自動駕駛的發展,競爭將更加激烈。相對于其他移動廠商,PowerVR在GPU的技術方面披露的比較多,其中比較經典當屬Rogue架構。Rogue架構采用的是延后式分塊渲染架構(TBDR),憑借該技術,Rogue架構曾一直是移動端GPU的標桿。作為蘋果移動端GPU的獨家供應商,也曾風光無限。本文就對Rogue架構進行一些分析,歡迎高手點評斧正。

架構概述

Rogue架構是一種可編程的架構,能夠支持通用計算和圖形渲染。Rogue架構針對頂點和像素的傳輸、計算數據在內存之間的傳輸以及數據和計算核心之間的交互等提供了不同的硬件。本文將側重于通用計算方面的特性。

如上圖所示,Rogue架構中通用計算相關的部件有計算數據控制器(Compute Data Master,CDM),粗粒度調度器(Coarse Grain Scheduler,CGS),統一渲染集群(Unified Shading Clusters),L1混合緩存(L1 Mixed Cache)。

GPU的整個計算流程是,CDM負責將CPU分配的單個任務拆分為多個子任務,然后傳遞給CGS,由CGS將多個獨立的子任務部署到USC上去執行。只有計算任務是由CDM處理的,所以CDM是計算任務專用的通道。

每個USC pair包含兩個USCs和一個紋理處理單元(Texture Processing Unit,TPU),這樣可以有效的平衡紋理訪問和計算。USC是Rogue架構中的主要計算單元。TPU是一種專門加速內核代碼中訪問圖像和紋理的硬件,它擁有獨立的緩存,能夠加速處理器對圖像數據的訪問。對于一些需要對圖像進行專門訪問的算法和一些大尺寸的圖像,TPU可以提供很好的加速效果。

L1混合緩存是Rogue架構的主要緩存,所有對內存的訪問都會首先在這里緩存。當數據讀取不能使用該緩存的時候,則會使用系統級緩存。系統級的高速緩存直接與系統RAM交互,也是數據命中緩存的最后機會。

統一渲染集群(USC)

Rogue架構中負責計算的核心部件是USC,是一個可編程的標量SIMD處理器,通常包含16個ALU Pilelines,用來執行計算內核中代碼。下圖為Rogue架構中的USC示意圖。

圖中包含多種部件,我們只關心兩種,一種是內存,一種是ALU。USC內部的內存空間主要包括兩個寄存器組,一個是Common Store,由整個USC共享;一個是Unified Store,每4個ALU 管線(Pipelines)共享一塊。

Unified Store是USC中4個小的由寄存器組成的存儲體,每個存儲體被4個ALU Pipes所共享,對應于OpenCL中的私有存儲。每個Unified store包含1280個128-bit的寄存器,也就是說,每個ALU管線平均擁有320個寄存器。例如,如果每個線程申請10個寄存器,那么,每個USC上只能執行512個線程(每個ALU管線執行32個線程,需要320個寄存器),這也是達到推薦占有率所需最小的線程數。由于每個線程擁有獨立的寄存器等資源,所以可以實現0開銷的warp切換,切換的時候不需要進行中間數據轉存。當然在具體計算中,每個線程即OpenCL的WorkItem所能擁有的寄存器,與多種因素有關。

這128位的寄存器可以像4個32位寄存器一樣,被內核有效的訪問,所以內核最多可以使用40個32位寄存器,達到推薦的利用率。如果一個給定的內核需要的寄存器不止這些,此時駐留的任務就會減少,減少執行每個任務的線程數量,這樣每個線程就會獲得更多的寄存器空間。Imagination的編譯器只會降低利用率,因為占有率對于隱藏線程中的延遲是至關重要的。

USC利用率(USC/Multiprocessor utilization),是指USC執行活動的warp所用的時間與被阻斷的時間之比。如下圖所示,其利用率為75%。

USC的占有率是指駐留的warps與可用的駐留槽的比率。如下圖所示,展示了駐留的warps和可用warps的示意圖。駐留槽的數量與具體產品有關,大多是16個。圖中的占有率為6/16。

所以,當寄存器不夠用的時候,編譯器會犧牲利用率,保證占有率,有利于隱藏延遲。如果寄存器溢出嚴重,利用率不會無限制降低,會達到一個限度后,將溢出的寄存器分配到主存儲器中,也就是全局存儲(global memory),這樣會造成很高的帶寬和延遲成本,大幅度降低程序的性能。當然,這種調度是有軟件控制的,所以不同的設備之間會有區別。

Common Store就是通常意義上的共享內存,它是對一個USC中的所有ALU Pipelines可見的,主要用于線程之間的數據交換,任何共享的內存都存儲在這個位置,例如OpenCL的local memory,OpenGL的share memory。它也用于存儲對象句柄,例如圖像,紋理和采樣器狀態等。

Common Store被分配在4個存儲體中,每個存儲體可看作是一個128位寬的數列,如下圖所示。

在Common Store中,可以同時從4個存儲體中獲取數據,整個數據行可以在單周期內讀取,例如一個任務中的16個線程從同一行獲取連續數據(綠色部分),那么每個線程可以在一個周期內獲取32位值。但是,如果多于一個線程試圖從同一列訪問數據(紅色部分),則會導致存儲體沖突,因為每個周期,存儲體只能提供一次訪問請求,因此請求將被序列化,大大降低訪問性能。為了避免存儲體沖突,Common Store中的數據應該跨行訪問,每周期訪問不同存儲體中的4個128位寄存器。

ALU Pipelines是USC中的計算單元,結構圖如下圖所示。這是Series7XT ALUs示意圖。Rogue架構中每個USC包含16個ALU Pipelines,每個ALU中包含有FP16,FP32等核心用于計算。不同型號的GPU包含的ALU core類型不同,數量也不同。例如在Series7XT Plus GPU中增加了Integer Pipelines,能夠支持Int8和Int16等整數類型,可以大幅度提升GPU性能,在Series7XT GPU中增加了FP64。FP16核心也不是Rogue架構的標配,早期型號也是沒有的。

根據ALU core的數量和時鐘頻率,可以很方便的計算出GPU的理論峰值。可采用如下公式:

例如Series7XT系列中的GT7600包含6個USC,一共有192個FP32 core or 384個FP16 core。時鐘頻率有三種可定制,分別為650MHz, 800MHz和1GHz。以650MHz為例,其峰值性能為:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4910

    瀏覽量

    130654
  • 人工智能
    +關注

    關注

    1804

    文章

    48705

    瀏覽量

    246473
  • 架構
    +關注

    關注

    1

    文章

    527

    瀏覽量

    25852
  • 寒武紀
    +關注

    關注

    11

    文章

    199

    瀏覽量

    74212

原文標題:移動GPU的經典:淺析Rogue架構

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能人工智能是未來發展的必然趨勢嗎?以后人工智能技術真的能達到電影里機器人的智能水平嗎?如果技術成熟的那一天
    發表于 09-16 15:40

    百度人工智能大神離職,人工智能的出路在哪?

    發展規劃,加快新材料、人工智能、集成電路、生物制藥、第五代移動通信等技術研發和轉化”,這是“人工智能”首次出現在***工作報告中。兩會上,百度CEO李彥宏、小米董事長雷軍、吉利控股集團董事長李書福等來自
    發表于 03-23 17:00

    人工智能到底用 GPU?還是用 FPGA?

    GPU 和 FPGA。有人說 GPU 好用;有人說 FPGA 靈活可編程;有人說 GPU 運算能力強,適合對人工智能進行“訓練”;有人說做“推斷”還得靠 FPGA … 作為程序員,您
    發表于 08-23 15:42

    人工智能就業前景

    據相關招聘機構數據顯示,2018年AI領域仍然是大部分資深技術人才轉崗的首選目標,在人才最緊缺的前十大職位中,時下最火的大數據、人工智能、算法類崗位占據半壁江山。據調查指出,2017年技術研發類崗位
    發表于 03-29 15:46

    人工智能AI經典入門書

    人工智能AI經典入門書,很難找的噢,給喜歡的朋友
    發表于 09-12 17:13

    解讀人工智能的未來

    `已歷經60多年的人工智能在物聯網以及大數據的推動下,實現飛躍式的發展,并且迎來了第三個黃金周期。必優傳感今天和大家解讀一下關于人工智能的未來。自從有了人工智能,引發了人類的各種“未來論”。有人說
    發表于 11-14 10:43

    人工智能醫生未來或上線,人工智能醫療市場規模持續增長

      導讀:機構預測,中國醫療人工智能的市場需求已達數百億元。專家認為,“人工智能醫生”的應用,有利于緩解社會老齡化帶來的醫療資源供需失衡以及地域分配不均等問題。那么,“人工智能醫生”何時能真正
    發表于 02-24 09:29

    人工智能:超越炒作

    。對于人工智能用例在當前物聯網環境中變為現實,必須滿足三個條件:非常大的真實數據集具有重要處理能力的硬件架構和環境開發新的強大算法和人工神經網絡(ANN)以充分利用上述內容很明顯,后兩種要求相互依賴,并且
    發表于 05-29 10:46

    什么是基于云計算的人工智能服務?

    如今,采用人工智能的企業遇到了一個主要障礙,那就是在內部開發人工智能產品成本高昂,因此有了外包人工智能產品的需求。而對于從中小企業到預算受限的大型企業來說,通過云計算來采用人工智能的成
    發表于 09-11 11:51

    人工智能芯片是人工智能發展的

    人工智能芯片是人工智能發展的 | 特倫斯謝諾夫斯基責編 | 屠敏本文內容經授權摘自《深度學習 智能時代的核心驅動力量》從AlphaGo的人機對戰,到無人駕駛汽車的上路,再到AI合成主播上崗
    發表于 07-27 07:02

    物聯網人工智能是什么?

    一、人工智能介紹工作以后想要拿高薪的話,人工智能是你的不二之選,那么問題來了,究竟什么是人工智能呢?又需要了解哪些才能去開發人工智能產品呢?接下來小編帶領大家進入
    發表于 09-09 14:12

    移動終端人工智能技術與應用開發》人工智能的發展與AI技術的進步

    人工智能的發展是隨著人類生活需要,產業需求不斷提升的,其中人工智能的發展很大程度上受到了計算機算力的影響,隨著數據處理量的增大,人工智能算法對算力的要求逐年增加,而且沒過兩年算力上升一倍,因此往往
    發表于 02-17 11:00

    移動終端人工智能技術與應用開發》+快速入門AI的捷徑+書中案例實操

    操作系統的終端應用程序開發經驗的讀者閱讀。該書從移動終端人工智能技術應用的現狀和發展態勢講起,對深度學習與軟件框架等相關基礎知識進行了介紹。第2章從總體上介紹移動終端AI技術架構,包括
    發表于 02-19 20:24

    移動終端人工智能技術與應用開發》+理論學習

    收到《移動終端人工智能技術與應用開發》有一段時間了,由于時間有限,加上工作原因,目前只看到第3章,前幾章主要介紹人工智能和機器學習的基礎知識,發展歷程,分類等,重點說明了,在移動終端上
    發表于 02-27 23:28

    《通用人工智能:初心與未來》-試讀報告

    作者給出的結論。整體讀下來,可以給我們關于通用人工智能全面的了解。作者也反復強調了通用人工智能與專用智能的區別。尤其是人們錯誤的認為一堆專用智能堆砌起來就是通用
    發表于 09-18 10:02
    主站蜘蛛池模板: 性生生活三级视频在线观看 | 婷婷色在线播放 | 大尺度免费高清在线观看视频 | 色135综合网| 视频一区二区在线 | 天天插天天干天天操 | 欧美一级黄视频 | 全黄h全肉边做边吃奶在线观看 | 躁天天躁中文字幕在线 | 男女交性拍拍拍高清视频 | 中国性猛交xxxx乱大交 | 亚洲免费网 | haodiaose在线精品免费观看 | 久久天天躁狠狠躁夜夜 | 九色视频在线播放 | 天天干天天操天天射 | 糖心vlog麻豆精东影业传媒 | 在线永久免费播放视频 | 美女扒开尿口给男人桶 | 国产福利99| 五月四房婷婷 | 免费观看黄a一级视频日本 免费观看黄色网页 | 精品国产乱码久久久久久浪潮 | 奇米影视9999 | 玖玖在线国产精品 | 美女扒开尿囗给男人玩的动图 | 99久久国产免费中文无字幕 | 一本久草 | 97天天做天天爱夜夜爽 | 男女www视频在线看网站 | videosgratis乱色欧美野外 | 午夜想想爱午夜剧场 | 3344a毛片在线看 | 欧美成人伊人久久综合网 | 免费看片免费播放 | 免费人成在线观看视频色 | 天天干视频网站 | 欧美日韩一区在线观看 | 最好看的2019中文字幕1 | 性猛交xxxx乱大交孕妇 | 国产三级日本三级美三级 |