在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

電子工程師 ? 來源:祥瑞Coding ? 作者:祥瑞Coding ? 2021-03-30 10:29 ? 次閱讀

Xilinx zynq系列FPGA實現神經網絡評估

本篇目錄

1. 內存占用

1.1FPGA程序中內存的實現方式

1.2Zynq的BRAM內存大小

1.3一個卷積操作占用的內存

2. PipeCNN可實現性

PipeCNN論文解析:用OpenCL實現FPGA上的大型卷積網絡加速

2.1已實現的PipeCNN資源消耗

3. 實現大型神經網絡的方法

4. Virtex-7高端FPGA概覽、7系列FPGA相關文檔

正文

0Zynq7000系列概覽

0003cb24-8c66-11eb-8b86-12bb97331649.png

1內存占用

1.1 FPGA程序中內存的實現方式

參閱xilinx文檔UG998

0072ceac-8c66-11eb-8b86-12bb97331649.png

FPGA并沒有像軟件那樣用已有的cache,FPGA的HLS編譯器會在FPGA中創建一個快速的memory architecture以最好的適應算法中的數據樣式(data layout)。因此FPGA可以有相互獨立的不同大小的內部存儲空間,例如寄存器,移位寄存器,FIFOs和BRAMs

寄存器:最快的內存結構,集成在在運算單元之中,獲取不需要額外的時延。

移位寄存器:可以被當作一個數據序列,每一個數據可以在不同的運算之中被重復使用。將其中所有數據移動到相鄰的存儲設備中只需要一個時鐘周期。

FIFO:只有一個輸入和輸出的數據序列,通常被用于循環或循環函數,細節會被HLS編譯器處理。

BRAM:集成在FPGA fabric模塊中的RAM,每個xilinx的FPGA中集成有多個這樣的BRAM。可以被當作有以下特性的cache:1.不支持像處理器cache中那樣的緩存一致性(cache coherency,collision),不支持處理器中的一些邏輯類型。2.只在設備有電時保持內存。3.不同的BRAM塊可以同時傳輸數據。

1.2Zynq的BRAM內存大小

00c36cea-8c66-11eb-8b86-12bb97331649.png

zynq 7z020的BRAM為4.9Mb,7z035的BRAM為17.6Mb(2.2MB)

01190222-8c66-11eb-8b86-12bb97331649.png

1.3一個卷積操作占用的內存

例如,我們實現的卷積函數,輸入27×600,卷積核16×27,輸出16×600,數據類型為float。

//convolution operationfor (i = 0; i < 16; i++) { for (j = 0; j < 600; j++) { result = 0; for (k = 0; k < 27; k++) { temp = weights[i*27+k] * buf_in[k*600+j]; result += temp; } buf_out[i*600+j] = result; } }


在HLS中生成的IPcore占用硬件資源為:

0160a9ce-8c66-11eb-8b86-12bb97331649.png

01b2c808-8c66-11eb-8b86-12bb97331649.png

01ed1d28-8c66-11eb-8b86-12bb97331649.png

在vivado中搭建好系統,占用的資源為:

02359c38-8c66-11eb-8b86-12bb97331649.png

02960b4a-8c66-11eb-8b86-12bb97331649.png

2PipeCNN可實現性

PipeCNN是一個基于OpenCL的FPGA實現大型卷積網絡的加速器。

PipeCNN解析文檔:

PipeCNN論文解析:用OpenCL實現FPGA上的大型卷積網絡加速

github地址:https://github.com/doonny/PipeCNN#how-to-use

2.1 已實現的PipeCNN資源消耗

對于Altera FPGA,運用Intel's OpenCL SDKv16.1 toolset.

對于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

02e38640-8c66-11eb-8b86-12bb97331649.png

Xilinx'sKCU1500(XCKU115 FPGA)(已經有xilin的板子實現過pipeCNN,但是型號比zynq高很多)

02f51388-8c66-11eb-8b86-12bb97331649.png

硬件資源可以被三個宏調控,device/hw_param.cl. Change the following macros

VEC_SIZE

LANE_NUM

CONV_GP_SIZE_X

消耗資源為:

034797a2-8c66-11eb-8b86-12bb97331649.png

03873a74-8c66-11eb-8b86-12bb97331649.png

3實現大型神經網絡的方法

方案一:壓縮模型到<2.2MB,可實現在BRAM中

優點:1.速度快 2.實現方便

缺點:1.模型壓縮難度 2.難以實現大型網絡

方案二:用FPGA調用DDR

優點:1.速度中等 2.可實現大型網絡

缺點:調用DDR有難度,開發周期長

方案三:用片上單片機調用DDR(插入SD卡)分包傳入IPcore運算

優點:可實現大型網絡

缺點:速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA,比Zynq高了一個檔次。

0443f25e-8c66-11eb-8b86-12bb97331649.png

048220e2-8c66-11eb-8b86-12bb97331649.png

7系列FPGA相關文檔:

04cc1b3e-8c66-11eb-8b86-12bb97331649.png

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1631

    文章

    21806

    瀏覽量

    606638
  • 神經網絡
    +關注

    關注

    42

    文章

    4785

    瀏覽量

    101273
  • Xilinx
    +關注

    關注

    71

    文章

    2172

    瀏覽量

    122322

原文標題:Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Xilinx ZYNQ 7000系列SoC的功能特性

    本文介紹下Xilinx ZYNQ 7000系列SoC的功能特性、資源特性、封裝兼容性以及如何訂購器件。
    的頭像 發表于 10-24 15:04 ?1400次閱讀
    <b class='flag-5'>Xilinx</b> <b class='flag-5'>ZYNQ</b> 7000<b class='flag-5'>系列</b>SoC的功能特性

    FPGA在深度神經網絡的應用

    、低功耗等特點,逐漸成為深度神經網絡在邊緣計算和設備端推理的重要硬件平臺。本文將詳細探討FPGA在深度神經網絡的應用,包括其優勢、設計流程、關鍵技術以及實際應用案例。
    的頭像 發表于 07-24 10:42 ?841次閱讀

    分享幾個用FPGA實現的小型神經網絡

    今天我們分享幾個用FPGA實現的小型神經網絡,側重應用。
    的頭像 發表于 07-24 09:30 ?1362次閱讀
    分享幾個用<b class='flag-5'>FPGA</b><b class='flag-5'>實現</b>的小型<b class='flag-5'>神經網絡</b>

    神經網絡專用硬件實現的方法和技術

    神經網絡專用硬件實現是人工智能領域的一個重要研究方向,旨在通過設計專門的硬件來加速神經網絡的訓練和推理過程,提高計算效率和能效比。以下將詳細介紹神經網絡專用硬件
    的頭像 發表于 07-15 10:47 ?1459次閱讀

    遞歸神經網絡實現方法

    (Recurrent Neural Network,通常也簡稱為RNN,但在此處為區分,我們將循環神經網絡稱為Recurrent RNN)不同,遞歸神經網絡更側重于處理樹狀或圖結構的數據,如句法分析樹、自然語言的語法結構等。以下將從遞歸
    的頭像 發表于 07-10 17:02 ?419次閱讀

    如何在FPGA實現神經網絡

    可編程門陣列(FPGA)作為一種靈活、高效的硬件實現方式,為神經網絡的加速提供了新的思路。本文將從FPGA實現
    的頭像 發表于 07-10 17:01 ?2388次閱讀

    BP神經網絡和人工神經網絡的區別

    BP神經網絡和人工神經網絡(Artificial Neural Networks,簡稱ANNs)之間的關系與區別,是神經網絡領域中一個基礎且重要的話題。本文將從定義、結構、算法、應用及未來發展等多個方面,詳細闡述BP
    的頭像 發表于 07-10 15:20 ?1388次閱讀

    rnn是遞歸神經網絡還是循環神經網絡

    RNN(Recurrent Neural Network)是循環神經網絡,而非遞歸神經網絡。循環神經網絡是一種具有時間序列特性的神經網絡,能夠處理序列數據,具有記憶功能。以下是關于循環
    的頭像 發表于 07-05 09:52 ?681次閱讀

    遞歸神經網絡是循環神經網絡

    遞歸神經網絡(Recurrent Neural Network,簡稱RNN)和循環神經網絡(Recurrent Neural Network,簡稱RNN)實際上是同一個概念,只是不同的翻譯方式
    的頭像 發表于 07-04 14:54 ?910次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需要從多個維度進行深入分析。這些維度包括
    的頭像 發表于 07-04 13:20 ?1097次閱讀

    反向傳播神經網絡和bp神經網絡的區別

    反向傳播神經網絡(Backpropagation Neural Network,簡稱BP神經網絡)是一種多層前饋神經網絡,它通過反向傳播算法來調整網絡
    的頭像 發表于 07-03 11:00 ?885次閱讀

    卷積神經網絡實現原理

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡實現原理、結構
    的頭像 發表于 07-03 10:49 ?692次閱讀

    卷積神經網絡的原理與實現

    1.卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 卷積神經網絡是一種前饋神經網絡,其
    的頭像 發表于 07-02 16:47 ?754次閱讀

    神經網絡在數學建模的應用

    數學建模是一種利用數學方法和工具來描述和分析現實世界問題的過程。神經網絡是一種模擬人腦神經元結構和功能的計算模型,可以用于解決各種復雜問題。在數學建模神經網絡可以作為一種有效的工具
    的頭像 發表于 07-02 11:29 ?1147次閱讀

    神經網絡的激活函數有哪些

    神經網絡,激活函數是一個至關重要的組成部分,它決定了神經元對于輸入信號的反應方式,為神經網絡引入了非線性因素,使得網絡能夠學習和處理復雜
    的頭像 發表于 07-01 11:52 ?690次閱讀
    主站蜘蛛池模板: 国产精品乱码高清在线观看 | 五月婷婷在线播放 | 国产性夜夜春夜夜爽 | 欧美一级特黄aaa大片 | 久久国产精品免费 | 日本最猛黑人xxxx猛交 | 婷婷综合五月天 | 亚洲欧美视频在线 | 狠狠色丁香六月色 | 最新久久免费视频 | 亚洲精品在线免费观看视频 | 亚洲精品成人a | 久久婷婷国产精品香蕉 | 黄色一级毛片网站 | 丁香六月色婷婷综合网 | 欧美三级在线免费观看 | 三级在线观看国产 | 在线免费观看一级片 | 午夜精品在线观看 | 不良视频在线观看 | 久久九九国产精品怡红院 | 午夜剧场刺激性爽免费视频 | 色综合欧美综合天天综合 | 天堂视频在线观看 | 天天尻逼 | 亚洲欧美啪啪 | aa毛片 | 免费一级特黄特色大片在线 | 香蕉视频国产在线观看 | 狼色影院 | 35pao强力打造 | 一级特黄aaa大片 | 国内a级毛片免费··· | 在线免费日韩 | 视频一区中文字幕 | 日本高清视频不卡 | 婷婷色综合久久 | 精品欧美一区二区三区在线观看 | 黄到让你下面湿的视频 | 免费日本黄色 | 男人j进女人j的视频一进一出 |