在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

神經(jīng)網(wǎng)絡(luò)加速器架構(gòu)的優(yōu)劣分析

454398 ? 來源:AI加速微信公眾號 ? 作者:AI加速微信公眾號 ? 2020-11-02 17:22 ? 次閱讀

神經(jīng)網(wǎng)絡(luò)加速器基本上是一個中介拓?fù)浼軜?gòu)的神經(jīng)網(wǎng)絡(luò)加速器,其通過指令解析模塊將不同指令分發(fā)到不同的數(shù)據(jù)處理模塊。這些數(shù)據(jù)處理模塊共享片上的存儲。這種結(jié)構(gòu)的優(yōu)點有:

1) 結(jié)構(gòu)簡單,控制起來容易。對應(yīng)每個數(shù)據(jù)處理模塊都對應(yīng)一個復(fù)雜指令,在進(jìn)行神經(jīng)網(wǎng)絡(luò)加速的時候,只需要根據(jù)神經(jīng)網(wǎng)絡(luò)的中的不同數(shù)據(jù)計算部分,提取出可在硬件上進(jìn)行布置的部分,根據(jù)這部分完成指令編寫。同時一個神經(jīng)網(wǎng)絡(luò)的計算流圖決定了不同類型指令之間的依賴關(guān)系。

2) 可擴(kuò)展性強(qiáng)。數(shù)據(jù)處理模塊可以任意進(jìn)行擴(kuò)展,對應(yīng)著指令集也可以任意增加。每個模塊和指令的接口以及cache的接口形式是一定的,它們之間可以通過cache來進(jìn)行數(shù)據(jù)交互。指令集和模塊的增加和減少都不會影響到整體架構(gòu)。我們只要開發(fā)出新的模塊IP以及指令就夠了。

我個人認(rèn)為,目前的架構(gòu)還存在如下缺陷:

1) 架構(gòu)不夠靈活。相對于千變?nèi)f化的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其只能加速有限的的計算模塊。而且如果不同神經(jīng)網(wǎng)絡(luò)之間進(jìn)行切換的時候,如果這兩種神經(jīng)網(wǎng)絡(luò)差別很大,則可能造成不太好找到一個比較匹配的XRNN結(jié)構(gòu)。比如一個神經(jīng)網(wǎng)絡(luò)要用到模塊A,但是另外一個神經(jīng)網(wǎng)絡(luò)要用到模塊B,那么我們的架構(gòu)就需要將模塊A和B都加上,這樣才能適合兩種網(wǎng)絡(luò)。當(dāng)然也可以選擇不加,但是終歸是有模塊不能得到充分利用。

2) 不同數(shù)據(jù)處理模塊之間通過cache進(jìn)行數(shù)據(jù)交互,以及指令分發(fā)造成了延時。這對于一個大的神經(jīng)網(wǎng)絡(luò)來說,這些開銷占比很小,但是當(dāng)一個神經(jīng)網(wǎng)絡(luò)很小,計算復(fù)雜的時候,不同模塊之間的數(shù)據(jù)交互就會降低整體效能。

3) 介于AI芯片GPU之間的尷尬處境。使用FPGA來進(jìn)行神經(jīng)網(wǎng)絡(luò)加速器,和GPU比不過算力,同時又不能像AI芯片那樣具有高速和充足資源的特點。所以針對大計算的網(wǎng)絡(luò),面對GPU我們的性能很難PK過。

4) FPGA的優(yōu)勢沒有顯現(xiàn)出來??梢院虶PU等競爭的優(yōu)勢在于FPGA的動態(tài)可重配置以及流水線處理,這些是GPU等芯片不具備的。流水線可以容納更多的計算核,而且能夠減少計算核之間數(shù)據(jù)延時,而可重配置的特點可以更好的適配千變?nèi)f化的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。這兩個優(yōu)點在神經(jīng)網(wǎng)絡(luò)加速器中也得到了一定的體現(xiàn),比如矩陣乘法核的大小,cache大小都是可配置的。而且不同的計算模塊之間還可以做一定的直連,也能夠降低讀寫cache帶來的延時。但是這些特點還并沒有得到很好的利用。

圖架構(gòu)設(shè)想:

對于神經(jīng)網(wǎng)絡(luò)加速器,我們總是渴望在FPGA上構(gòu)建一個統(tǒng)一的IP核,能夠盡力去適應(yīng)不同的神經(jīng)網(wǎng)絡(luò),能夠盡力去加速每個神經(jīng)網(wǎng)絡(luò)。于是乎,我們增加了一個個模塊IP,不斷擴(kuò)充指令集。但是這些都受到了兩個條件的制約:一個是FPGA資源的有限性,另外一個就是神經(jīng)網(wǎng)絡(luò)的千變?nèi)f化。如果我們換一種思路,不去追求一種統(tǒng)一的神經(jīng)網(wǎng)絡(luò)加速IP,而是基于FPGA可重配置特點構(gòu)建一種平臺,在這個平臺下,可以由用戶根據(jù)需要加速的不同神經(jīng)網(wǎng)絡(luò)來自行搭建一套加速器。而我們要做的就是,建立一個IP庫,庫里包含各種計算IP,比如矩陣乘法,向量加法,concat,embedding等等。整個平臺來根據(jù)網(wǎng)絡(luò)模型選擇不同IP來構(gòu)建一個神經(jīng)網(wǎng)絡(luò)加速器。

基本設(shè)想的結(jié)構(gòu)是這樣的:

硬核IP不僅僅包括在FPGA上開發(fā)出的各種計算核,還包含有CPU,因為FPGA資源限制以及計算的復(fù)雜性,并不是所有的神經(jīng)網(wǎng)絡(luò)計算都可以在FPGA上實現(xiàn)。

軟件根據(jù)網(wǎng)絡(luò)模型,分析哪些計算可以用FPGA實現(xiàn),評估其實現(xiàn)性能,選擇最適合在FPGA上進(jìn)行加速的計算。同時需要評估FPGA資源情況,配置每個核的大小,使用資源等。然后根據(jù)神經(jīng)網(wǎng)絡(luò)計算流圖,確定不同IP核的連接關(guān)系,構(gòu)建圖。

圖結(jié)構(gòu)大致設(shè)想如下:

不同節(jié)點代表一個計算模塊,這些模塊之間直接通過數(shù)據(jù)流交互,不經(jīng)過共享內(nèi)存的方式,計算可以實現(xiàn)流水。節(jié)點控制器對每個節(jié)點實現(xiàn)參數(shù)配置,和數(shù)據(jù)流控制,數(shù)據(jù)流控制也很簡單,只需要控制數(shù)據(jù)閘門的開關(guān),以及數(shù)據(jù)量流通的多少就行了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1630

    文章

    21802

    瀏覽量

    606388
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    809

    瀏覽量

    38121
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4783

    瀏覽量

    101236
收藏 人收藏

    評論

    相關(guān)推薦

    PowerVR Series2NX神經(jīng)網(wǎng)絡(luò)加速器設(shè)計

    我的母親是一名護(hù)士,目前已經(jīng)退休。她是一個非常聰明的人,對自己的工作業(yè)務(wù)非常的盡職盡責(zé)。幾天前我和她說我正在研究Imagination最新的神經(jīng)網(wǎng)絡(luò)加速器,她詫異的說:你說的是什么意思?,當(dāng)然只有
    的頭像 發(fā)表于 06-19 18:36 ?5631次閱讀
    PowerVR Series2NX<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b><b class='flag-5'>加速器</b>設(shè)計

    張量計算在神經(jīng)網(wǎng)絡(luò)加速器中的實現(xiàn)形式

    引言 神經(jīng)網(wǎng)絡(luò)中涉及到大量的張量運(yùn)算,比如卷積,矩陣乘法,向量點乘,求和等。神經(jīng)網(wǎng)絡(luò)加速器就是針對張量運(yùn)算來設(shè)計的。一個神經(jīng)網(wǎng)絡(luò)加速器通常都
    的頭像 發(fā)表于 11-02 13:52 ?2998次閱讀
    張量計算在<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b><b class='flag-5'>加速器</b>中的實現(xiàn)形式

    一種基于FPGA的圖神經(jīng)網(wǎng)絡(luò)加速器解決方案

    的形式呈現(xiàn)給讀者。對圖神經(jīng)網(wǎng)絡(luò)(GNN)的介紹在宏觀層面上,GNN的架構(gòu)與傳統(tǒng)CNN有很多相似之處,諸如卷積層、池化、激活函數(shù)、機(jī)器學(xué)習(xí)處理(MLP)、全連接層(FC layer)等模塊,這些都可以
    發(fā)表于 09-25 17:20

    【書籍評測活動NO.18】 AI加速器架構(gòu)設(shè)計與實現(xiàn)

    創(chuàng)新的芯片架構(gòu)設(shè)計,這正面臨新的挑戰(zhàn)。本書從神經(jīng)網(wǎng)絡(luò)分析出發(fā),總結(jié)和提煉了AI加速器架構(gòu)設(shè)計中常見的難點,以及解決這些難點的技術(shù)、方法和思
    發(fā)表于 07-28 10:50

    《 AI加速器架構(gòu)設(shè)計與實現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀后感

    《 AI加速器架構(gòu)設(shè)計與實現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀感 ? ?在本書的引言中也提到“一圖勝千言”,讀完第一章節(jié)后,對其進(jìn)行了一些歸納(如圖1),第一章對常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了介紹,
    發(fā)表于 09-11 20:34

    《 AI加速器架構(gòu)設(shè)計與實現(xiàn)》+學(xué)習(xí)和一些思考

    ,如有錯誤還望大佬們指出,我馬上改正。 目錄和進(jìn)度 目前閱讀到第一章,先更新到第一章的內(nèi)容吧 卷積神經(jīng)網(wǎng)絡(luò) 運(yùn)算子系統(tǒng)的設(shè)計 儲存子系統(tǒng)的設(shè)計 架構(gòu)優(yōu)化技術(shù) 安全與防護(hù) 神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 09-16 11:11

    《 AI加速器架構(gòu)設(shè)計與實現(xiàn)》+第2章的閱讀概括

    。 從名字上就能看出來書里可能覆蓋的內(nèi)容是和CNN加速器有關(guān)的內(nèi)容了。 作者在前言里說這本書主要討論Inference(推理)的過程,“主要討論神經(jīng)網(wǎng)絡(luò)硬件,尤其是芯片設(shè)計層面的內(nèi)容”。這本書的第2,3章
    發(fā)表于 09-17 16:39

    Imagination發(fā)布最新神經(jīng)網(wǎng)絡(luò)加速器

    Imagination Technologies宣布推出其面向人工智能(AI)應(yīng)用的最新神經(jīng)網(wǎng)絡(luò)加速器(NNA)架構(gòu)PowerVR Series3NX。
    的頭像 發(fā)表于 12-06 16:09 ?3515次閱讀

    多項第一!Imagination神經(jīng)網(wǎng)絡(luò)加速器通過AIIA DNN benchmark評估

    基于端側(cè)推斷任務(wù)深度神經(jīng)網(wǎng)絡(luò)處理基準(zhǔn)測試結(jié)果中,Imagination的神經(jīng)網(wǎng)絡(luò)加速器在多個框架測試中成績名列第一!
    的頭像 發(fā)表于 07-12 15:23 ?5321次閱讀

    嵌入式神經(jīng)網(wǎng)絡(luò)加速器的市場需求將持續(xù)增加

    隨著許多嵌入式系開始變得智能且自主,以人工智能(AI)神經(jīng)網(wǎng)絡(luò)為導(dǎo)向的嵌入式系統(tǒng)市場即將起飛,神經(jīng)網(wǎng)絡(luò)加速器大戰(zhàn)一觸發(fā)。
    發(fā)表于 11-22 11:40 ?1051次閱讀

    美信半導(dǎo)體新型神經(jīng)網(wǎng)絡(luò)加速器MAX78000 SoC

    ? ? 新型神經(jīng)網(wǎng)絡(luò)加速器 Maxim Integrated的新型MAX78000芯片,基于雙核MCU,結(jié)合了超低功耗深度神經(jīng)網(wǎng)絡(luò)加速器,為高性能人工智能 (AI) 應(yīng)用提供所需的算力
    的頭像 發(fā)表于 01-04 11:48 ?3070次閱讀

    神經(jīng)網(wǎng)絡(luò)加速器簡述

    神經(jīng)網(wǎng)絡(luò)加速器基本概念。
    發(fā)表于 05-27 15:22 ?13次下載

    基于FPGA的SIMD卷積神經(jīng)網(wǎng)絡(luò)加速器

    一種基于FPGA的SIM卷積神經(jīng)網(wǎng)絡(luò)加速器架構(gòu)。以YOOV2目標(biāo)檢測算法為例,介紹了將卷積神經(jīng)網(wǎng)絡(luò)模型映射到FPGA上的完整流程;對加速器
    發(fā)表于 05-28 14:00 ?24次下載

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機(jī)器學(xué)習(xí)領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式,通過復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)信息的處理、存儲和傳遞。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,各種
    的頭像 發(fā)表于 07-01 14:16 ?882次閱讀

    什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點?

    )和圖形處理(GPU)雖然可以處理神經(jīng)網(wǎng)絡(luò)計算,但在能效比和計算密度上往往難以滿足特定應(yīng)用場景的需求。因此,神經(jīng)網(wǎng)絡(luò)加速器應(yīng)運(yùn)而生,它通過優(yōu)化硬件
    的頭像 發(fā)表于 07-11 10:40 ?585次閱讀
    主站蜘蛛池模板: 一区二区免费看 | 黄色三级在线看 | 人人揉揉香蕉大免费不卡 | 97色网| 色香影院 | 91在线国内在线播放大神 | 天天摸夜夜爽 | 中文字幕一精品亚洲无线一区 | a级黄视频 | 久久精品国波多野结衣 | 天天操夜夜操天天操 | 亚洲日本一区二区 | 色人阁婷婷 | 日韩手机看片 | a一级日本特黄aaa大片 | 亚洲欧美网站 | 色老二精品视频在线观看 | 久久久久久久综合狠狠综合 | 激情久久婷婷 | 国模久久 | 天天色天天搞 | 色综合激情丁香七月色综合 | 亚洲第一永久在线观看 | 日本加勒比一区 | 婷婷资源综合 | 很黄很黄的网站免费的 | 农村苗族一级特黄a大片 | 免费jlzzjlzz在线播放视频 | 天天摸夜班摸天天碰 | 天堂网在线www资源在线 | 香蕉视频在线免费播放 | 天天好比网 | 五色网| 天天性综合 | 靓装爱神12丝袜在线播放 | 中文4480yy私人免费影院 | 青青青久97在线观看香蕉 | 四虎一区二区三区精品 | 免费的黄色大片 | 日本免费人成在线网站 | www.97色|