在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

寒武紀歷代深度學習處理器的各種參數信息

倩倩 ? 來源:我是天邊飄過一朵云 ? 2020-04-17 09:04 ? 次閱讀

寒武紀神經網絡處理器是中科院計算技術研究所發布的能運行深度神經網絡實現人工智能算法的處理器硬件架構,下面是小編整理的寒武紀歷代深度學習處理器的各種參數信息,大家不妨來看看。

1. 寒武紀1號:DianNao

陳天石等人提出的DianNao是寒武紀系列的第一個原型處理器結構,包含一個處理器核,主頻為0.98GHz,峰值性能達每秒4520億次神經網絡基本運算(如加法、乘法等),65mm工藝下功耗為0.485W,面積3.02平方毫米。在若干代表性神經網絡上的實驗結果表明,DianNao的平均性能超過主流CPU核的100倍,面積和功耗僅為CPU核的1/30~1/5,效能提升達三個數量級;DianNao的平均性能與主流通用圖形處理器(NVIDIA K20M)相當,但面積和功耗僅為后者的百分之一量級。

DianNao要解決的核心問題是如何使有限的內存帶寬滿足運算功能部件的需求,使運算和訪存之間達到平衡,從而實現高效能比。其難點在于選取運算功能部件的數量、組織策略以及片上隨機存儲器(RAM)的結構參數。由于整個結構參數空間有上千萬種選擇,而模擬器運行速度不及真實芯片的十萬分之一,我們不可能蠻力嘗試各種可能的設計參數。為解決此問題,提出了一套基于機器學習的處理器性能建模方法,并基于該模型最終為DianNao選定了各項設計參數,在運算和訪存間實現了平衡,顯著提升了執行神經網絡算法時的效能。

即使數據已經從內存移到了片上,搬運的能耗依然非常高。英偉達公司首席科學家史蒂夫·凱科勒(Steve Keckler)曾經出,在40m工藝下,將64位數據搬運20毫米的能耗是做64位浮點乘法的數倍。因此,要降低處理器功耗,僅僅降低運算功耗是不夠的,必須對片上數據搬運進行優化。我們提出了對神經網絡進行分塊處理,將不同類型的數據塊存放在不同的片上隨機存儲器中,并建立理論模型來刻畫隨機存儲器與隨機存儲器、隨機存儲器與運算部件、隨機存儲器與內存之間的搬運次數,進而優化神經網絡運算所需的數據搬運次數。相對于CPU/GPU上基于緩存層次的數據搬運,DianNao可將數據搬運次數減少至前者的1/30~1/10。

2. 寒武紀2號:DaDianNao

近年來興起的深度神經網絡在模式識別領域取得了很好的應用效果,但這類神經網絡的隱層數量和突觸數量遠多于傳統神經網絡。例如,著名的谷歌大腦包括了100多億個突觸。百度采用的大規模深度學習神經網絡包含200多億個突觸。急劇增長的神經網絡規模給神經網絡處理器帶來了挑戰。單個核已經難以滿足不斷增長的應用需求。將神經網絡處理器擴展至多核成為自然之選。DaDianNao在DianNao的基礎上進一步擴大了處理器的規模,包含16個處理器核和更大的片上存儲,并支持多處理器芯片間直接高速互連,避免了高昂的內存訪問開銷。在28nm工藝下,DaDianNao的主頻為606MHz,面積67.7平方毫米,功耗約16W。單芯片性能超過了主流GPU的21倍,而能耗僅為主流GPU的1/330。64芯片組成的計算系統的性能較主流GPU提升450倍,但總能耗僅為后者的1/150。

3. 寒武紀3號:PuDianNao

神經網絡已成為模式識別等領域的主流算法,但用戶很多時候可能更傾向于使用其他一些經典的機器學習算法。例如程序化交易中經常使用線性回歸這類可解釋性好、復雜度低的算法。在此背景下,我們研發了寒武紀3號多用途機器學習處理器---PuDianNao,可支持k-最近鄰、k-均值、樸素貝葉斯、線性回歸、支持向量機、決策樹、神經網絡等近10種代表性機器學習算法。在65nm工藝下,PuDianNao的主頻為1GHz,峰值性能達每秒10560億次基本操作,面積3.51平方毫米,功耗為0.596W。PuDianNao運行上述機器學習算法吋的平均性能與主流通用圖形處理器相當,但面積和功耗僅為后者的百分之一量級。PuDianNao的結構設計主要有兩個難點:運算單元設計和存儲層次設計,分別對應于機器學習的運算特征和結構特征。其中運算單元設計的出發點是高效實現機器學習最頻繁的運算操作,而存儲層次設計則主要根據訪存特征提高各機器學習算法中數據的片內重用,降低片外訪存帶寬的需求,充分發揮運算單元的計算能力,避免片外訪存成為性能瓶頸。在運算單元設計方面,提出了一種機器學習運算單元(Machine Learning Unit, MLU)來支持各種機器學習方法中共有的核心運算,包括:點積(線性回歸、支持向量機、神經網絡)、距離計算(k-最近鄰、k-均值)計數(決策樹和樸素貝葉斯)、排序(k-最近鄰、k-均值)和非線性函數計算(支持向量機和神經網絡)等。機器學習運算單元被分成了計數器、加法器、乘法器、加法樹、Acc和Misc6個流水線階段。

在存儲層次設計方面,設計了HotBuf(HB)、ColdBuf(CB)和OutputBuf(OB)3個片上數據緩存HotBuf存儲輸入數據,具有最短重用距離的數據。ColdBuf存放相對較長重用距離的輸入數據。OutputBuf存儲輸出數據或者臨時結果。這樣設計的原因有兩個:第一,在各種機器學習算法中,數據的重用距離通常可以分為兩類或三類,因此設計了3個片上數據緩存;第二,機器學習算法中不同類型的數據讀取寬度不同,因此設置了分開的緩存來降低不同的寬度帶來的開銷。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4811

    瀏覽量

    103029
  • 算法
    +關注

    關注

    23

    文章

    4702

    瀏覽量

    94950
  • 寒武紀
    +關注

    關注

    11

    文章

    199

    瀏覽量

    74261
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    寒武紀“炸裂”財報!一季度營收增長40倍,積極備貨應對“爆單”?

    電子發燒友網報道(文/梁浩斌)寒武紀,交出一份炸裂財報!在4月18日,寒武紀公布了2024年年報和2025年一季度報告,其中2024年全年營收11.74億元,同比增長65.56%;虧損4.52億元
    的頭像 發表于 04-22 09:07 ?1139次閱讀
    <b class='flag-5'>寒武紀</b>“炸裂”財報!一季度營收增長40倍,積極備貨應對“爆單”?

    寒武紀3000億市值與GPU廠商密集IPO,AI芯片正是當打之年

    ? 電子發燒友網報道(文/黃晶晶)就在最近,寒武紀市值沖上3000億元,創造了半導體企業的市值奇跡。2024年1月10日收盤當天寒武紀股價報729.97元,上漲2.48%,市值3047億元。盤中最
    的頭像 發表于 01-20 08:16 ?3509次閱讀
    <b class='flag-5'>寒武紀</b>3000億市值與GPU廠商密集IPO,AI芯片正是當打之年

    寒武紀思元370芯片參數特性詳解

    寒武紀首次采用chiplet技術將2顆AI計算芯粒封裝為一顆AI芯片,通過不同芯粒組合規格多樣化的產品,為用戶提供適用不同場景的高性價比AI芯片。
    的頭像 發表于 04-24 17:49 ?884次閱讀
    <b class='flag-5'>寒武紀</b>思元370芯片<b class='flag-5'>參數</b>特性詳解

    寒武紀一季度營收大漲4230% 凈利潤3.55億 扭虧為盈

    4月18日晚間,國產AI芯片龍頭寒武紀發布了財務報告,包括有2025年第一季度財務報告和2024年年度財務報告。 在2025年第一季度,寒武紀營收達到11.11億,同比增長高達4230.22
    的頭像 發表于 04-19 14:15 ?862次閱讀

    美國業務收入占比低,寒武紀等回應加征關稅

    相關產品和技進行了限制。本次加征關稅,對公司的經營管理不會造成實質性影響。 ? 公司自成立以來一直專注于人工智能芯片產品的研發與技術創新,致力于打造人工智能領域的核心處理器芯片,公司的主營業務是應用于各類云服務、邊緣計算設備、終端設
    發表于 04-12 00:59 ?613次閱讀
    美國業務收入占比低,<b class='flag-5'>寒武紀</b>等回應加征關稅

    寒武紀增資全資子公司上海寒武紀

    近日,寒武紀科技公司發布公告,宣布了一項重要的增資計劃。為了保障募投項目的順利實施,并滿足全資子公司上海寒武紀的實際運營需求,寒武紀決定使用募集資金1500萬元及自有資金1.85億元,合計2億元
    的頭像 發表于 02-05 13:44 ?576次閱讀

    量子處理器是什么_量子處理器原理

    量子處理器(QPU)是量子計算機的核心部件,它利用量子力學原理進行高速數學和邏輯運算、存儲及處理量子信息。以下是對量子處理器的詳細介紹:
    的頭像 發表于 01-27 11:53 ?849次閱讀

    寒武紀發布2024年度業績預告

    昨日晚間,國內領先的智能芯片設計企業寒武紀發布了其2024年度的業績預告。據公告顯示,公司預計全年營業收入將在10.7億元至12億元之間,與去年同期相比,實現了50.83%至69.16%的顯著增長
    的頭像 發表于 01-15 10:30 ?604次閱讀

    NPU與傳統處理器的區別是什么

    和GPU相比,NPU在處理深度學習任務時展現出了顯著的優勢。 1. 設計目的 傳統處理器: CPU(中央處理單元): CPU是通用
    的頭像 發表于 11-15 09:29 ?1093次閱讀

    NPU在深度學習中的應用

    設計的硬件加速,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的
    的頭像 發表于 11-14 15:17 ?1788次閱讀

    深度學習GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發表于 10-17 10:07 ?567次閱讀

    FPGA做深度學習能走多遠?

    并行計算的能力,可以在硬件層面并行處理大量數據。這種并行處理能力使得 FPGA 在執行深度學習算法時速度遠超傳統處理器,能夠提供更低的延遲和
    發表于 09-27 20:53

    算力概念股寒武紀20cm漲停市值重回千億

    7月16日整個算力概念板塊上漲;寒武紀(688256)上漲達20%,股價創年內新高,成交額超42億,寒武紀的總市值重回千億大關。 此外,紫光股份(000938)、海光信息(688041)等概念股同步
    的頭像 發表于 07-17 15:30 ?947次閱讀

    細數各種音頻處理器

    HiFi音頻系統需要具備高質量的音頻處理器,以保證音頻信號在處理和傳輸過程中能夠盡可能地保持原始音質和細節。每種處理器的選擇和配置應根據具體的音頻設備、使用場景和個人偏好來進行優化和調整。這些
    的頭像 發表于 07-10 16:36 ?1757次閱讀
    細數<b class='flag-5'>各種</b>音頻<b class='flag-5'>處理器</b>

    深度學習的模型優化與調試方法

    深度學習模型在訓練過程中,往往會遇到各種問題和挑戰,如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學習模型進行優化與調試是確保其性能優越的
    的頭像 發表于 07-01 11:41 ?1708次閱讀
    主站蜘蛛池模板: 岛国午夜 | 国产真实乱偷人视频 | 99久久国产免费福利 | 大黄网站在线观看 | 国产精品午夜寂寞视频 | 天天狠狠色噜噜 | 成年美女黄网站色大免费视频 | 国内精品一区二区在线观看 | 午夜一级黄色片 | 91亚洲国产成人久久精品网站 | 奇米影视777欧美在线观看 | 性欧美丰满xxxx性久久久 | 欧美一级视频在线观看欧美 | 国产色婷婷精品免费视频 | 色综合久久久久综合99 | 亚洲成人免费在线观看 | 在线视频 二区 | 人人看人人做 | 青青操久久 | 五月婷婷一区二区 | 国内精品久久久久影院免费 | 天天摸夜夜摸成人免费视频 | 91精品日本久久久久久牛牛 | 色成年激情久久综合 | 伊人网址| 毛片视频网址 | 男女交黄 | 婷婷丁香激情五月 | 免费在线观看的视频 | 在线播放免费视频 | 天天干视频在线 | 精品亚洲成a人片在线观看 精品亚洲大全 | 国模久久 | www射| 欧洲综合网 | 九九热在线视频观看这里只有精品 | 在线激情网 | 成 年 人 视频在线播放 | 久操伊人网 | 5月婷婷6月丁香 | 亚洲va久久久久综合 |