在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

FPGA之家 ? 來源:FPGA之家 ? 作者:FPGA之家 ? 2022-04-07 11:31 ? 次閱讀

0Zynq7000系列概覽

94155fe2-b5e8-11ec-aa7f-dac502259ad0.png

1內存占用

1.1 FPGA程序中內存的實現方式

參閱xilinx文檔UG998

942dedb4-b5e8-11ec-aa7f-dac502259ad0.png

FPGA并沒有像軟件那樣用已有的cache,FPGA的HLS編譯器會在FPGA中創建一個快速的memory architecture以最好的適應算法中的數據樣式(data layout)。因此FPGA可以有相互獨立的不同大小的內部存儲空間,例如寄存器,移位寄存器,FIFOs和BRAMs

寄存器:最快的內存結構,集成在在運算單元之中,獲取不需要額外的時延。

移位寄存器:可以被當作一個數據序列,每一個數據可以在不同的運算之中被重復使用。將其中所有數據移動到相鄰的存儲設備中只需要一個時鐘周期。

FIFO:只有一個輸入和輸出的數據序列,通常被用于循環或循環函數,細節會被HLS編譯器處理。

BRAM:集成在FPGA fabric模塊中的RAM,每個xilinx的FPGA中集成有多個這樣的BRAM。可以被當作有以下特性的cache:1.不支持像處理器cache中那樣的緩存一致性(cache coherency,collision),不支持處理器中的一些邏輯類型。2.只在設備有電時保持內存。3.不同的BRAM塊可以同時傳輸數據。

1.2Zynq的BRAM內存大小

94409540-b5e8-11ec-aa7f-dac502259ad0.png

zynq 7z020的BRAM為4.9Mb,7z035的BRAM為17.6Mb(2.2MB)

9451e96c-b5e8-11ec-aa7f-dac502259ad0.png

1.3一個卷積操作占用的內存

例如,我們實現的卷積函數,輸入27×600,卷積核16×27,輸出16×600,數據類型為float。

  //convolution operation

for (i = 0; i < 16; i++) {

    for (j = 0; j < 600; j++) {

      result = 0;

      for (k = 0; k < 27; k++) {

        temp = weights[i*27+k] * buf_in[k*600+j];

        result += temp;

      }

      buf_out[i*600+j] = result;

    }

  }


在HLS中生成的IPcore占用硬件資源為:

94768290-b5e8-11ec-aa7f-dac502259ad0.png

948c8400-b5e8-11ec-aa7f-dac502259ad0.png

9499078e-b5e8-11ec-aa7f-dac502259ad0.png

在vivado中搭建好系統,占用的資源為:

94a95382-b5e8-11ec-aa7f-dac502259ad0.png

94b7ea3c-b5e8-11ec-aa7f-dac502259ad0.png

2PipeCNN可實現性

PipeCNN是一個基于OpenCL的FPGA實現大型卷積網絡的加速器。

PipeCNN解析文檔:

PipeCNN論文解析:用OpenCL實現FPGA上的大型卷積網絡加速

github地址:https://github.com/doonny/PipeCNN#how-to-use

2.1 已實現的PipeCNN資源消耗

對于Altera FPGA,運用Intel's OpenCL SDKv16.1 toolset.

對于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

94c7cd1c-b5e8-11ec-aa7f-dac502259ad0.png

Xilinx'sKCU1500(XCKU115 FPGA)(已經有xilin的板子實現過pipeCNN,但是型號比zynq高很多)

94e36eaa-b5e8-11ec-aa7f-dac502259ad0.png

硬件資源可以被三個宏調控,device/hw_param.cl. Change the following macros

  • VEC_SIZE

  • LANE_NUM

  • CONV_GP_SIZE_X

消耗資源為:

94f89c80-b5e8-11ec-aa7f-dac502259ad0.png

95070432-b5e8-11ec-aa7f-dac502259ad0.png

3實現大型神經網絡的方法

方案一:壓縮模型到<2.2MB,可實現在BRAM中

優點:1.速度快 2.實現方便

缺點:1.模型壓縮難度 2.難以實現大型網絡

方案二:用FPGA調用DDR

優點:1.速度中等 2.可實現大型網絡

缺點:調用DDR有難度,開發周期長

方案三:用片上單片機調用DDR(插入SD卡)分包傳入IPcore運算

優點:可實現大型網絡

缺點:速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA,比Zynq高了一個檔次。

951bc20a-b5e8-11ec-aa7f-dac502259ad0.png

952c0bc4-b5e8-11ec-aa7f-dac502259ad0.png

7系列FPGA相關文檔:

95392c3c-b5e8-11ec-aa7f-dac502259ad0.png

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1644

    文章

    21993

    瀏覽量

    615438
  • 寄存器
    +關注

    關注

    31

    文章

    5427

    瀏覽量

    123726
  • 神經網絡
    +關注

    關注

    42

    文章

    4811

    瀏覽量

    103051

原文標題:Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    FPGA程序內存的實現方式

    ? ? Xilinx zynq系列FPGA實現神經網絡評估
    發表于 07-10 09:24 ?2199次閱讀

    脈沖耦合神經網絡FPGA上的實現誰會?

    脈沖耦合神經網絡(PCNN)在FPGA上的實現實現數據分類功能,有報酬。QQ470345140.
    發表于 08-25 09:57

    【PYNQ-Z2申請】基于PYNQ的神經網絡自動駕駛小車

    ,分享項目的開展,實施過程,結果,展示項目結果,并全程開源項目源碼。本人一直非常希望學習與實踐Xilinx Zynq系列FPGA芯片與基于FPGA
    發表于 12-19 11:36

    【PYNQ-Z2試用體驗】基于PYNQ的神經網絡自動駕駛小車 - 項目規劃

    小車運動的控制信號,實現小車自動駕駛。在初步實現方案,為了快速實現整體功能,使用軟件神經網絡作為控制器,使用單片機作為底盤電機的控制器。在
    發表于 03-02 23:10

    基于賽靈思FPGA的卷積神經網絡實現設計

    FPGA實現卷積神經網絡 (CNN)。CNN 是一類深度神經網絡,在處理大規模圖像識別任務以及與機器學習類似的其他問題方面已大獲成功。在當前案例
    發表于 06-19 07:24

    如何設計BP神經網絡圖像壓縮算法?

    (Digital Signal Processor)相比,現場可編程門陣列(Field Programma-ble Gate Array,FPGA)在神經網絡實現上更具優勢。DSP處理器在處理時采用指令順序執行
    發表于 08-08 06:11

    如何移植一個CNN神經網絡FPGA

    )第二步:使用Lattice sensAI 軟件編譯已訓練好的神經網絡,定點化網絡參數。該軟件會根據神經網絡結構和預設的FPGA資源進行分析
    發表于 11-26 07:46

    基于FPGA神經網絡的性能評估及局限性

    FPGA實現神經網絡關鍵問題分析基于FPGA的ANN實現方法基于FPGA
    發表于 04-30 06:58

    EdgeBoard神經網絡算子在FPGA實現方法是什么?

    FPGA加速的關鍵因素是什么?EdgeBoard神經網絡算子在FPGA實現方法是什么?
    發表于 09-28 06:37

    FPGA實現大型神經網絡的設計

    1、加速神經網絡的必備開源項目  到底純FPGA適不適合這種大型神經網絡的設計?這個問題其實我們不適合回答,但是FPGA廠商是的實際操作是很有權威性的,現在不論是Intel還是
    發表于 10-24 16:10

    Xilinx Zynq系列FPGA實現神經網絡相關資源評估

    集成在FPGA fabric模塊的RAM,每個xilinxFPGA中集成有多個這樣的BRAM。可以被當作有以下特性的cache:1.不支持像處理器cache
    的頭像 發表于 03-30 10:29 ?1982次閱讀
    <b class='flag-5'>Xilinx</b> <b class='flag-5'>Zynq</b><b class='flag-5'>系列</b><b class='flag-5'>FPGA</b><b class='flag-5'>實現</b><b class='flag-5'>神經網絡</b><b class='flag-5'>中</b><b class='flag-5'>相關</b><b class='flag-5'>資源</b><b class='flag-5'>評估</b>

    如何用OpenCL實現FPGA上的大型卷積網絡加速?

    Xilinx zynq系列FPGA實現神經網絡評估
    的頭像 發表于 04-19 11:12 ?2865次閱讀
    如何用OpenCL<b class='flag-5'>實現</b><b class='flag-5'>FPGA</b>上的大型卷積<b class='flag-5'>網絡</b>加速?

    基于FPGA的RBF神經網絡硬件實現

    基于FPGA的RBF神經網絡硬件實現說明。
    發表于 04-28 11:24 ?27次下載

    基于FPGA神經網絡硬件實現方法

    基于FPGA神經網絡硬件實現方法說明。
    發表于 06-01 09:35 ?46次下載
    基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>神經網絡</b>硬件<b class='flag-5'>實現</b>方法

    如何在FPGA實現神經網絡

    可編程門陣列(FPGA)作為一種靈活、高效的硬件實現方式,為神經網絡的加速提供了新的思路。本文將從FPGA實現
    的頭像 發表于 07-10 17:01 ?3530次閱讀
    主站蜘蛛池模板: 天天爽夜夜爽天天做夜夜做 | 三区在线观看 | 三级黄色在线视频 | 亚洲色图偷窥自拍 | 天天摸夜夜摸成人免费视频 | 国产黄视频在线观看 | 色妞女女女女女bbbb | 影院在线观看免费 | 精品国产柚木在线观看 | 中文字幕11页 | 日韩免费无砖专区2020狼 | 操女人免费视频 | 人人干狠狠干 | 天天干天天射天天爽 | 免费人成黄页在线观看1024 | 特级片在线观看 | 一区二区三区高清 | 午夜操操| aaaaa国产毛片 | 91在线播放免费不卡无毒 | 色站视频 | 诱人的老师bd高清日本在线观看 | 伊人小婷婷色香综合缴缴情 | 九九精品免费观看在线 | 老熟女一级毛片 | 四虎永久免费网站免费观看 | 亚洲一区中文 | 亚洲理论片在线观看 | 99久久精品免费看国产 | 亚洲伊人电影 | 51精品国产 | 大片毛片女女女女女女女 | 女性私密部位扒开的视频 | 国语一级毛片私人影院 | 欧美aaaaa性bbbbb小妇 | 五月婷综合网 | 免费网址视频在线看 | ww欧洲ww在线视频看ww | japanese 69hdxxxx日本 | 国产福利免费观看 | 亚欧色 |