在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何提升NPU的能效比?

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:Nathan J ? 2022-08-01 11:19 ? 次閱讀

現如今,深度神經網絡正在以越來越大的規模部署,橫跨了從云端,自動駕駛IoT等平臺。比如用于圖像識別,語音識別及翻譯,癌癥檢測以及自動駕駛中對感知層海量數據的處理等。在很多領域,深度神經網絡的精度已經超越人類,它的優越性來源于它對原始數據的特征提取,并通過對大量數據的學習來獲取輸入空間的有效表征,但是它的高精度是以超高計算復雜度為代價。因此很多廠商都在追逐NPU的算力來解決這些復雜問題,但是隨著算力的提高,NPU設計也越來越復雜,將伴隨著面積和功耗的增加,這對于那些面積和功耗有很大限制的設備帶來了挑戰,因此如何提升NPU的能效比就成了亟待解決的問題。

6bdd29be-1147-11ed-ba43-dac502259ad0.png

NPU通過數據分區和有效調度,利用數據的重用以及執行分段來提高能效比和硬件利用率,而實現高利用率,數據重用將直接依賴于如何調度深度神經網絡的計算和如何將這些計算有效的映射到NPU的硬件單元上。以CNN為例,數據流無非包含三個方面filter(Weight),ifmap和ofmap,如下圖。

6bf2bb62-1147-11ed-ba43-dac502259ad0.png

因此在設計NPU時需要考慮如利用內存的層次結構,決定哪些數據要讀到那一層的內存中以及什么時候被處理,如何可以重用filter,ifmap和ofmap,將他們存放在本地內存中,從而大大減少DRAM的訪問次數,這將在很大程度上提高NPU的硬件利用率及性能,并減少由于DRAM訪問帶了的額外功耗。根據數據處理特征可以將數據流分為以下幾類:

1)、靜態weight

weight靜態數據流的設計是通過在PE的RF(Register File)中存取weight,來減少讀取weight產生的功耗。weight從DRAM讀取到RF并保持靜態以供進一步訪問,NPU在計算時盡可能多的利用RF中的weight以達到最大程度的重用。通常的實現是將ifmap廣播給所有的PE,部分和(Psum)將穿過所有的PE來完成空間上的累加。

6c0593b8-1147-11ed-ba43-dac502259ad0.png

2)、靜態輸出

輸出靜態數據流的設計是通過將accumulator產生的Psum存放到本地的RF中,以避免將Psum剛寫入DRAM再讀回,從而減少因Psum讀寫產生的功耗。通常的實現是流式輸入Activation,并將weight廣播給所有的PE。

6c19630c-1147-11ed-ba43-dac502259ad0.png

3)、無本地重用

如果考慮到RF會增大面積,可以將所有的數據都存放到Global Buffer中,這樣沒有任何數據會留在PE的RF,也不會增設RF單元來減小面積,但是增加了PE和Global Buffer的數據交互。具體來說是通過多廣播Activation,單廣播Weight以及Psum穿過所有的PE進行累加來實現的。

6c29f104-1147-11ed-ba43-dac502259ad0.png

4)、靜態行

靜態行數據流的目標是將所有的數據類型(Activation,weight, psum)的重用和計算都在RF中完成,來提升總體的能效。它區別于上面的靜態weight和靜態輸出,只是分別對weight和psum進行優化。

6c3b85a4-1147-11ed-ba43-dac502259ad0.png

具體選用哪種數據流方式要結合NPU微架構的設計。下面總結了來自于幾個廠家的NPU,它們分別利用了不同數據流類型來提高能效比。

6c461b0e-1147-11ed-ba43-dac502259ad0.png

參考文獻:

【1】Vivienne S. Yu-Hsin C.and etc., “Ef?cient Processing of Deep Neural Networks: A Tutorial and Survey”

關于復睿微電子:

復睿微電子是世界500強企業復星集團出資設立的先進科技型企業。復睿微電子植根于創新驅動的文化,通過技術創新改變人們的生活、工作、學習和娛樂方式。公司成立于2022年1月,目標成為世界領先的智能出行時代的大算力方案提供商,致力于為汽車電子人工智能、通用計算等領域提供以高性能芯片為基礎的解決方案。

目前主要從事汽車智能座艙、ADS/ADAS芯片研發,以領先的芯片設計能力和人工智能算法,通過底層技術賦能,推動汽車產業的創新發展,提升人們的出行體驗。在智能出行的時代,芯片是汽車的大腦。復星智能出行集團已經構建了完善的智能出行生態,復睿微是整個生態的通用大算力和人工智能大算力的基礎平臺。復睿微以提升客戶體驗為使命,在后摩爾定律時代持續通過先進封裝、先進制程和解決方案提升算力,與合作伙伴共同面對汽車智能化的新時代。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    459

    文章

    52253

    瀏覽量

    437094
  • 神經網絡
    +關注

    關注

    42

    文章

    4810

    瀏覽量

    102939
  • NPU
    NPU
    +關注

    關注

    2

    文章

    323

    瀏覽量

    19555

原文標題:ADS算力芯片NPU數據流的重用性

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    提升3倍!異構計算架構讓AI跑得更快更省電

    電子發燒友網報道(文/李彎彎)異構計算架構通過集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對不同計算任務的特點進行分工協作,從而在性能、和靈活性之間實現最優平衡
    的頭像 發表于 05-25 01:55 ?2468次閱讀

    交流充電樁負載提升技術

    隨著電動汽車普及率提升,交流充電樁的優化成為降低運營成本、減少能源浪費的核心課題。負載提升
    發表于 05-21 14:38

    和算力提升的衡量方法

    /h·W表示。 影響因素及優化方向? 技術升級?:采用變頻技術、高效電機等可提升,例如變頻空調通過動態調節功率減少能耗。 環境因素?:溫度、濕度等外部條件會影響實際
    的頭像 發表于 04-28 07:47 ?498次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>比</b>和算力<b class='flag-5'>提升</b>的衡量方法

    超越CPU/GPU:NPU如何讓AI“輕裝上陣”?

    電子發燒友網報道(文/李彎彎)NPU是一種專門為人工智能(AI)計算設計的處理器,主要用于高效執行神經網絡相關的運算(如矩陣乘法、卷積、激活函數等)。相較于傳統CPU/GPU,NPU
    的頭像 發表于 04-18 00:05 ?1883次閱讀

    雙倍陣列云,重新定義服務器性價比

    一、架構創新:高密度集成與躍升 ?陣列化芯片設計? 新一代服務器通過高密度集成芯片陣列(如72片QCS8550芯片)實現算力聚合,單片CPU算力提升50%、GPU算力提升230%+
    的頭像 發表于 03-26 08:35 ?212次閱讀
    雙倍<b class='flag-5'>能</b><b class='flag-5'>效</b>陣列云,重新定義服務器性價比

    AI服務器電源模塊:光頡高精密薄膜電阻0.01%精度如何提升

    貞光科技代理的品牌-光頡科技高精密薄膜電阻憑借0.01%的超高精度,在AI服務器電源模塊中實現了精確電壓分配、優化功率因數和減少熱損耗,顯著提升系統和可靠性。
    的頭像 發表于 03-20 16:57 ?300次閱讀
    AI服務器電源模塊:光頡高精密薄膜電阻0.01%精度如何<b class='flag-5'>提升</b><b class='flag-5'>能</b><b class='flag-5'>效</b>?

    電源濾波器協同優化:提升電源系統的關鍵路徑

    電源濾波器在現代電子設備中起著核心作用,其、性能穩定性和環境友好性直接關系到設備成本、性能和環保。元件選擇、參數優化、散熱設計和布局優化等是關鍵,多路電源并聯系統中的濾波器協同則可以顯著提升系統
    的頭像 發表于 03-18 16:49 ?325次閱讀

    IO模塊助力PLC,全面提升中水處理設備

    隨著我國環保事業的不斷發展,中水處理技術在工業、生活等領域發揮著越來越重要的作用。如何提高中水處理設備的,成為行業關注的焦點。本文將為您介紹明達技術高效解決方案——利用自主研發的分布式IO模塊配合PLC,實現中水處理設備
    的頭像 發表于 12-16 14:57 ?390次閱讀
    IO模塊助力PLC,全面<b class='flag-5'>提升</b>中水處理設備<b class='flag-5'>能</b><b class='flag-5'>效</b>

    Erp指令

    ErP指令EC244/2009、EC245/2009、EU1194/2012和標簽指令EU874/2012已經實行多年,歐盟委員會在近3年通過參照不斷改進的照明產品技術、環境和經濟因素以及實際
    的頭像 發表于 11-20 23:57 ?508次閱讀
    Erp指令<b class='flag-5'>能</b><b class='flag-5'>效</b>

    NPU的工作原理解析

    神經網絡的計算流程,顯著提高了處理速度和NPU通常集成在SoC(System on Chip)中,與CPU和GPU協同工作,共同完成復雜的計算任務。 NPU的架構
    的頭像 發表于 11-15 09:17 ?2597次閱讀

    NPU在邊緣計算中的優勢

    和GPU相比,NPU在處理神經網絡相關的計算任務時,能夠提供更高的和更快的處理速度。NPU通過優化數據流和計算結構,使得神經網絡的前向
    的頭像 發表于 11-15 09:13 ?1149次閱讀

    NPU技術如何提升AI性能

    隨著人工智能技術的飛速發展,深度學習作為AI領域的核心驅動力,對計算能力的需求日益增長。NPU技術應運而生,為AI性能的提升提供了強大的硬件支持。 NPU技術概述 NPU是一種專門為深
    的頭像 發表于 11-15 09:11 ?1326次閱讀

    什么是NPU芯片及其功能

    的設計靈感來源于人腦的神經網絡結構。人腦通過神經元和突觸的復雜網絡處理信息,而NPU芯片則通過模擬這種結構來提高數據處理的效率。與傳統的CPU和GPU相比,NPU芯片在處理深度學習任務時具有更高的
    的頭像 發表于 11-14 15:48 ?4826次閱讀

    AcrelEMS企業微電網管理平臺如何輔助企業進行能源平衡優化?

    安科瑞徐赟杰 18706165067 摘要 2022年6月29日工信部、發改委、財政部、生態環境部、國資委、市場監管總局六部門聯合下發《關于印發工業提升行動計劃的通知》(工信部聯節〔2022
    的頭像 發表于 11-13 11:13 ?421次閱讀
    AcrelEMS企業微電網<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平臺如何輔助企業進行能源平衡優化?

    智慧水務綜合管理系統-提高污水廠

    簡婷 安科瑞電氣股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水務管理平臺 1平臺概述 安科瑞電氣具備從終端感知、邊緣計算到管理平臺的產品*態體系,Acrel
    的頭像 發表于 10-21 14:14 ?456次閱讀
    智慧水務綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統-提高污水廠<b class='flag-5'>能</b><b class='flag-5'>效</b>
    主站蜘蛛池模板: xxx69欧美| 又黄又湿又爽 | 日本欧美一级 | 亚洲成人高清在线观看 | 色婷婷在线观看视频 | 亚洲精品久久久久午夜福 | 成人在线网 | 日日噜噜噜夜夜爽爽狠狠 | 色婷婷成人 | 天堂在线中文 | 羞羞视频靠逼视频大全 | 艹久久 | 韩国三级日本三级在线观看 | 日韩精品另类天天更新影院 | 亚洲国产福利 | 天堂8中文在线bt | 久久xxxx | 午夜免费啪在线观看视频网站 | 欧美三级免费看 | 亚洲已满18点击进入在线观看 | 日本黄色大片免费观看 | 国内精品哆啪啪 | 日干夜干天天干 | 狠狠操婷婷| 女69女人poren25 | 日本在线视频一区二区三区 | 2021成人国产精品 | 亚洲欧美7777| 夜夜天天干 | 毛片的网站 | 五月婷婷色网 | 美女免费视频黄 | 8844aa在线毛片 | 欧美性受一区二区三区 | 日韩欧美中文字幕在线播放 | 日韩欧美亚洲综合一区二区 | 六月综合激情 | 伊人久久成人爱综合网 | 人人乳乳香蕉大免费 | 丁香婷婷久久 | 五月婷婷七月丁香 |