FPGA上部署深度學習的算法模型的方法以及平臺

?今天給大家介紹一下FPGA上部署深度學習的算法模型的方法以及平臺。希望通過介紹，算法工程師在FPGA的落地上能“稍微”緩和一些，小白不再那么迷茫。阿chai最近在肝一個開源的項目，等忙完了會給大家出幾期FPGA上從零部署的教程，包括一些底層的開發、模型的量化推理等等，因為涉及的東西太多了，所以得分開寫。 ?

FPGA與“迷宮”

深度學習這里就不多介紹了，我們接下來介紹一下FPGA是什么。FPGA是現場可編程邏輯門陣列，靈活性非常高，現場編程真的香。說到這里小伙伴們可能還是不太明白，那么我們和ARM對比一下，ARM可以理解為比如這有一個迷宮，迷宮有很多進口也有對應的出口，道路中間有很多“暗門”可以走，對ARM芯片做編程就是觸發當中一條通路，路是死的，我們不好改變。FPGA是如果我們想要一個迷宮，FPGA給提供了一個大的“盒子”，里面有很多的“隔板”，我們自己搭建一條就可以了，你想要什么樣的路就什么樣子，類似玩我的世界，只不過“礦”是各種邏輯門。那就意味著，FPGA可以設計外圍電路也可以設計CPU，是不是很爽，當然，爽的背后開發難度也是相當的大的，這種“特定屬性”非常時候做人工智能的算法加速。由于制作特殊電路，FPGA之前經常用做信號處理中，配合DSP或者ARM使用，后來也有用FPGA或者CPLD搭建“礦機”當“礦老板”(祝愿”挖礦“的天天礦難)。

小白入門A：PYNQ

PYNQ是Python + ZYNQ，用Python進行FPGA開發，首先強調一點，Python近幾年非常火，雖然很強大，但是他開發硬件不是真的就做硬件，希望大家不要迷。教程：https://github.com/xupsh/Advanced-Embedded-System-Design-Flow-on-Zynq我們類比一下很火的MicroPython，使用Python開發硬件是得有特定的電路設計的，除非自己是大佬修改底層的固件，但是都修改底層了，是不是可以自己開發就好了。當然這個是面向小白的，對應的開發板如下圖。 ?這個板子類似我們之前玩MicroPython，也是各種調包。實際上ZYNQ是一個雙核ARM Cortex-A9處理器和一個FPGA，使用Python的話可以通過Jupyter進行開發，是不是很香，所以這個非常適合小白。FPGA上跑BNN(二值神經網絡)是非常不錯的，“PYNQ-Z1不同的機器學習數據集（dataset）的測試結果顯示：對于MNIST數據集PYNQ-Z1能實現每秒168000張圖片的分類，延遲102微妙，準確率達98.4%；對于CIFAR-10、SVHN、GTSRB數據集PYN1-Z1能實現每秒1700張圖片的分類，延遲2.2毫秒，準確率分別為80.1%、96.69%和97.66%，系統功耗均保持在2.5W左右。”

這個到底有多方便，我們看一段代碼，首先我們調用模型：

import?bnn hw_classifier?=?bnn.CnvClassifier(bnn.NETWORK_CNVW1A1,'cifar10',bnn.RUNTIME_HW) sw_classifier?=?bnn.CnvClassifier(bnn.NETWORK_CNVW1A1,'cifar10',bnn.RUNTIME_SW) 進行測試：

from?IPython.display?import?display im?=?Image.open('car.png') im.thumbnail((64,?64),?Image.ANTIALIAS) display(im)? car_class?=?hw_classifier.classify_image_details(im) print("{:?>10}{:?>13}".format("[CLASS]","[RANKING]")) for?i?in?range(len(car_class)): ????print("{:?>10}{:?>10}".format(hw_classifier.classes[i],car_class[i])) 同樣支持matplotlib進行數據可視化：

%matplotlib?inline import?matplotlib.pyplot?as?plt x_pos?=?np.arange(len(car_class)) fig,?ax?=?plt.subplots() ax.bar(x_pos?-?0.25,?(car_class/100.0),?0.25) ax.set_xticklabels(hw_classifier.classes,?rotation='vertical') ax.set_xticks(x_pos) ax.set plt.show() 這不就是Python嘛，真的是非常的方便，而且圖像處理也兼容使用Pillow。文件中給出了一些圖像識別的例子，大家可以去看看。改天阿chai給大家出一個從零搭建PYNQ的教程，包括模型的量化推理等等。

小白入門B：DPU

DPU是一個用于卷積神經網絡的可編程引擎。該單元包含寄存器配置模塊、數據控制器模塊和卷積計算模塊。當然，強大的PYNQ也是支持使用DPU的，如果用這個直接看Python的API就可以了，開發板可以使用ZCU104。大神很多直接用ZYNQ開整的，但是那個難度真的不適合初學者去看，等忙完了項目阿chai給小伙伴們整個這個的教程。

我們首先clone下來項目并且編譯：

git?clone?https://github.com/Xilinx/DPU-PYNQ.git cd?DPU-PYNQ/upgrade make 安裝pynq-dpu：

pip?install?pynq-dpu 啟動jupyter-notebook：

pynq?get-notebooks?pynq-dpu?-p?. 模型庫在如下鏈接中。模型庫：https://github.com/Xilinx/Vitis-AI/tree/v1.3對于DPU的設計，我們需要在自己的電腦上進行，在添加模塊后，我們使用如下命令進行編譯：

make?BOARD= 對于ZYNQ+DPU的開發過程阿chai會單獨出一期，因為涉及的東西太多了。。。

支持國產框架：Paddle-Lite

既然python都可以，那肯定Paddle-Lite這種推理框架也是可行的，百度也有專門的部署開發套件 EdgeBoard。EdgeBoard是基于Xilinx Zynq UltraScale+ MPSoC系列芯片打造的計算卡，芯片內部集成ARM處理器+GPU+FPGA的架構，既具有多核處理能力、也有視頻流硬解碼處理能力，還具有FPGA的可編程的特點。

其實部署的思路小伙伴們應該有一些眉目了，就是將自己訓練的深度學習模型轉換成Paddle Lite模型，然后移植到EdgeBoard開發板上進行測試。接下來我們簡單看看是怎樣操作的。EdgeBoard中模型的測試由json文件做管理：

{ ?"model":"測試的模型",? ?"combined_model":true,? ?"input_width":224, ?"input_height":224, ?"image":"測試的路徑", ?"mean":[104,117,124], ?"scale":1, ?"format":"BGR" ????"threshold":0.5 } 詳細的操作請前往Paddle Lite的GitHub，這里只做簡單的流程介紹。GitHub:?https://github.com/PaddlePaddle/Paddle-Lite如果不想編譯，直接在如下網址中下載編譯好的文件即可。編譯后的文件：https://ai.baidu.com/ai-doc/HWCE/Yk3b95s8o

1.安裝測試

我們首先在有在開發板上編譯Paddle Lite，編譯的時候需要設置cmake的參數，設置LITE_WITH_FPGA=ON和LITE_WITH_ARM=ON，問就是我們都用到。對應的FPGA的編譯腳本是lite/tools/build_FPGA.sh，我們執行即可。

sh?./lite/tools/build_fpga.sh make?publish_inference?-j2 接下來我們編譯示例demo，demo也在剛才的下載鏈接中。板子的使用過程請參考百度官方的文檔，文檔介紹的非常的清楚，阿chai這里就不花時間去講解使用過程了。然后進入demo中進行編譯：

#?classification cd?/home/root/workspace/sample/classification/???? mkdir?build cd?build cmake?.. make build目錄下會出現image_classify和video_classify兩個可執行文件，圖片預測運行image_classify文件。使用FPGA 進行resnet50進行測試：

./image_classify_fpga_preprocess?../configs/resnet50/drink.json?? 可以看到對應的輸出結果，同樣detection的模型測試方式也這樣操作。

2.可調用的接口

C++

C++的主要包括預處理以及預測庫的接口。

預處理接口主要是使用FPGA完成圖片的縮放、顏色空間轉換和mean/std操作。
預測庫接口主要完成模型的初始化、輸入參數構造、預測和結果獲取。

預處理接口示例：

/** ??*?判斷輸入圖像是否是wc?16對齊 ??*?width?輸入圖像寬度 ??*?channel?輸入圖像高度 ??**/ ?bool?img_is_align(int?width,?int?channel); ?/** ??*?對齊后的大小 ??*?width?輸入圖像寬度 ??*?channel?輸入圖像高度 ??**/ ?int?align_size(int?width,?int?channel); ?/** ??*?分配存放圖片的內存，析構函數會自動釋放?（目前支持BGR->RGB?RGB->BGR?YUV422->BGR?YUV->RGB）?圖像最大分辨率支持1080p ??*?height?輸入圖像的框 ??*?width?輸入圖像寬度 ??*?in_format?輸入圖像格式?參考image_format ??*?return?uint8_t*??opencv?Mat?CV_8UC3 ??**/ ?uint8_t*?mem_alloc(int?img_height,?int?img_width,?image_format?in_format); 預測庫使用步驟1、模型初始化，構建預測對象

?std::unique_ptr?g_predictor; ????PaddleMobileConfig?config; ????std::string?model_dir?=?j["model"]; ????config.precision?=?PaddleMobileConfig::FP32; ????config.device?=?PaddleMobileConfig::kFPGA; ????config.prog_file?=?model_dir?+?"/model"; ????config.param_file?=?model_dir?+?"/params"; ????config.thread_num?=?4; ????g_predictor?=?CreatePaddlePredictor(config); 2、輸入輸出參數

????std::vector?paddle_tensor_feeds; ????PaddleTensor?tensor; ????tensor.shape?=?std::vector<int>({1,?3,?input_height,?input_width}); ????tensor.data?=?PaddleBuf(input,?sizeof(input)); ????tensor.dtype?=?PaddleDType::FLOAT32; ????paddle_tensor_feeds.push_back(tensor); ????PaddleTensor?tensor_imageshape; ????tensor_imageshape.shape?=?std::vector<int>({1,?2}); ????tensor_imageshape.data?=?PaddleBuf(image_shape,?1?*?2?*?sizeof(float)); ????tensor_imageshape.dtype?=?PaddleDType::FLOAT32; ????paddle_tensor_feeds.push_back(tensor_imageshape); ????PaddleTensor?tensor_out; ????tensor_out.shape?=?std::vector<int>({}); ????tensor_out.data?=?PaddleBuf(); ????tensor_out.dtype?=?PaddleDType::FLOAT32; ????std::vector?outputs(1,?tensor_out); 3、預測

?g_predictor->Run(paddle_tensor_feeds,?&outputs); 4、獲取結果

?float?*data?=?static_cast<float?*>(outputs[0].data.data()); ????int?size?=?outputs[0].shape[0];

Python

EdgeBoard系統已經安裝了python環境，用戶可直接使用即可，同時python接口為用戶提供了paddlemobile的python安裝包以及示例工程。文件名稱說明

?	?
paddlemobile-0.0.1.linux-aarch64-py2.tar.gz	paddlemobile的python2安裝包
edgeboard.py	基于python的模型預測示例
api.py	edgeboard.py的api示例
configs.classification	分類模型的配置文件目錄，同C++示例的配置文件
configs.detection	檢測模型的配置文件目錄，同C++示例的配置文件
models.classification	分類模型的模型文件目錄，同C++示例的模型文件
models.detection	檢測模型的模型文件目錄，同C++示例的模型文件

安裝paddlemobile-python SDK，在根目錄中解壓

tar?-xzvf??home/root/workspace/paddlemobile-0.0.1.linux-aarch64-py2.tar.gz 例如使用分類模型的測試如下：

python?api.py?-j?你測試的json文件詳細的使用說明請關注Paddle-Lite的GitHub。 ?介紹了這幾種，其實大家可以看出來，入門使用并不難，難的是底層的硬件設計與算法加速量化等等，這些都是打包好的東西，我們真的開發還是得慢慢的扣底層的。在這里借用一位大神說的話，現在人工智能算法工程師和十年前的嵌入式工程師差不多，從需求到硬件、軟件、算法、應用等等都能做，貌似真的是這樣，太卷了，不多學點真的要涼。工具是越來越好用，難的是輪子怎么造，一起加油。

? ? ? 審核編輯：彭靜

閱讀全文

FPGA(591969) FPGA(591969)
可編程(39058) 可編程(39058)
算法模型(6705) 算法模型(6705)
深度學習(119797) 深度學習(119797)

相比GPU和GPP，FPGA是深度學習的未來？

相比GPU和GPP，FPGA在滿足深度學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。同時，算法

2016-07-28 12:16:38

7349

如何才能高效地進行深度學習模型訓練？

分布式深度學習框架中，包括數據/模型切分、本地單機優化算法訓練、通信機制、和數據/模型聚合等模塊。現有的算法一般采用隨機置亂切分的數據分配方式，隨機優化算法（例如隨機梯度法）的本地訓練算法，同步或者異步通信機制，以及參數平均的模型聚合方式。

2018-07-09 08:48:22

13608

目前主流的深度學習算法模型和應用案例

深度學習在科學計算中獲得了廣泛的普及，其算法被廣泛用于解決復雜問題的行業。所有深度學習算法都使用不同類型的神經網絡來執行特定任務。

2024-01-03 10:28:21

460

2017全國深度學習技術應用大會

和知識引導的模型和方法，是人工智能下一步發展面臨主要挑戰之一。本報告將匯報對這一挑戰問題的若干思考以及在知識圖譜構建、Q-A問答和序列學習等方面的一些研究工作。　　4、報告題目：腦啟發計算　　報告人

2017-03-22 17:16:00

FPGA在深度學習應用中或將取代GPU

，這使得它比一般處理器更高效。但是，很難對 FPGA 進行編程，Larzul 希望通過自己公司開發的新平臺解決這個問題。專業的人工智能硬件已經成為了一個獨立的產業，但對于什么是深度學習算法的最佳

2024-03-21 15:19:45

深度學習模型是如何創建的？

具有深度學習模型的嵌入式系統應用程序帶來了巨大的好處。深度學習嵌入式系統已經改變了各個行業的企業和組織。深度學習模型可以幫助實現工業流程自動化，進行實時分析以做出決策，甚至可以預測預警。這些AI

2021-10-27 06:34:15

深度學習DeepLearning實戰

一：深度學習DeepLearning實戰時間地點：1 月 15日— 1 月18 日二：深度強化學習核心技術實戰時間地點： 1 月 27 日— 1 月30 日(第一天報到授課三天；提前環境部署電腦

2021-01-09 17:01:54

深度學習在預測和健康管理中的應用

方法方面的最新進展，目的是發現研究差距并提出進一步的改進建議。在簡要介紹了幾種深度學習模型之后，我們回顧并分析了使用深度學習進行故障檢測，診斷和預后的應用。該調查驗證了深度學習對PHM中各種類型的輸入

2021-07-12 06:46:47

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度學習技術的開發與應用

時間安排大綱具體內容實操案例三天關鍵點1.強化學習的發展歷程2.馬爾可夫決策過程3.動態規劃4.無模型預測學習5.無模型控制學習6.價值函數逼近7.策略梯度方法8.深度強化學習-DQN算法系列9.

2022-04-21 14:57:39

深度融合模型的特點

深度融合模型的特點，背景深度學習模型在訓練完成之后，部署并應用在生產環境的這一步至關重要，畢竟訓練出來的模型不能只接受一些公開數據集和榜單的檢驗，還需要在真正的業務場景下創造價值，不能只是為了PR而

2021-07-16 06:08:20

部署基于嵌入的機器學習模型

1、如何在生產中部署基于嵌入的機器學習模型　　由于最近大量的研究，機器學習模型的性能在過去幾年里有了顯著的提高。雖然這些改進的模型開辟了新的可能性，但是它們只有在可以部署到生產應用中時才開始提供真正

2022-11-02 15:09:52

AI工程師 10 個深度學習方法

什么”。從根本上講，機器學習是運用算法從原始數據中提取信息，并用某種類型的模型進行表示，然后使用該模型對一些尚未用模型表示的其他數據來進行推斷。神經網絡就是機器學習各類模型中的其中一類，并且已經存在了至少

2019-03-07 20:17:28

Mali GPU支持tensorflow或者caffe等深度學習模型嗎

Mali GPU 支持tensorflow或者caffe等深度學習模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓練

2022-09-16 14:13:01

Nanopi深度學習之路(1)深度學習框架分析

著手，使用Nanopi2部署已訓練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應用，會在復雜的深度學習歷程中有些成就感。目前已有幾十種流行的深度學習算法庫，參考網址：https

2018-06-04 22:32:12

TDA4對深度學習的重要性

，這比較類似于人腦的運行方式，獲得更多數據后，準確度也會越來越高。TIDL（TI Deep LearningLibrary）是TI平臺基于深度學習算法的軟件生態系統，可以將一些常見的深度學習算法模型

2022-11-03 06:53:11

labview+yolov4+tensorflow+openvion深度學習

，是因為這些算法給其他領域提供了很多參考和借鑒意義。比如本文討論的缺陷檢測，上面的很多網絡的特點，以及方法都給了我們很多的啟發，我們在設計網絡結構的時候，配合自己在產線部署的硬件性能，設計適合項目

2021-05-10 22:33:46

labview深度學習應用于缺陷檢測

標注產品后通過訓練平臺完成模型訓練經過少量樣品訓練得到測試結果，表明深度學習對傳統視覺算法比較棘手的缺陷檢測方面，能簡單粗暴的解決問題，后續就是增加缺陷樣品的收集，標注，以及模型的訓練。龍哥手把手教

2020-08-16 18:12:01

labview實現深度學習，還在用python？

算法。其編程特點是上手快，開發效率高，兼容性強，能快速調用c++，c#等平臺的dll類庫。如何將labview與深度學習結合起來，來解決視覺行業越來越復雜的應用場景所遇到的困難。下面以開關面板為例講解

2020-07-23 20:33:10

labview調用深度學習tensorflow模型非常簡單，附上源碼和模型

本帖最后由 wcl86 于 2021-9-9 10:39 編輯 `labview調用深度學習tensorflow模型非常簡單，效果如下，附上源碼和訓練過的模型：[hide][/hide

2021-06-03 16:38:25

　　華為云深度學習服務，讓企業智能從此不求人

學習平臺以及業界常用的深度學習引擎，免除企業自己搭建深度學習平臺之苦。　　　　同時，華為云深度學習服務，內置大量基于開源數據集訓練好的模型，并支持模型選擇自動化。用戶在進行企業自己的模型訓練時，只需要

2018-08-02 20:44:09

【FPGA-F3】阿里云FAAS平臺，極大簡化FPGA開發部署流程

摘要：阿里FPGA云服務器平臺FaaS（FPGA as a Service）在云端提供統一硬件平臺與中間件，可大大降低加速器的開發與部署成本。普惠開發者FPGA (現場可編程門陣列)由于其硬件并行

2018-05-17 20:17:46

【米爾FZ3深度學習計算卡試用體驗】搭建Vitis Ai系統平臺并測試

框架和最新的模型，能夠執行不同的深度學習任務· 提供一系列全面的預先優化模型，這些模型現已就緒，可隨時部署在 Xilinx 器件上。您可以找到最相似的模型，開始針對您的應用重新訓練！· 提供功能強大

2020-12-03 19:22:13

【米爾百度大腦EdgeBoard邊緣AI計算盒試用連載】III. 板載深度學習DEMO-detection測試-上(ZMJ)

ARM A53處理器+GPU+FPGA的架構，具有多核心處理能力、 FPGA可編程能能力以及視頻流硬件解碼能力等特點；內置了基于Linux操作系統+百度深度學習平臺-飛槳（Paddle）定制的深度學習

2021-04-02 19:56:41

【詳解】FPGA：深度學習的未來？

（FPGA）提供了另一個值得探究的解決方案。日漸流行的FPGA設計工具使其對深度學習領域經常使用的上層軟件兼容性更強，使得FPGA更容易為模型搭建和部署者所用。FPGA架構靈活，使得研究者能夠在諸如GPU

2018-08-13 09:33:30

為什么說FPGA是機器深度學習的未來？

都出現了重大突破。深度學習是這些領域中所最常使用的技術，也被業界大為關注。然而，深度學習模型需要極為大量的數據和計算能力，只有更好的硬件加速條件，才能滿足現有數據和模型規模繼續擴大的需求。　　 FPGA

2019-10-10 06:45:41

人工智能AI-卷積神經網絡LabVIEW之Yolov3+tensorflow深度學習有用嗎？

python編程語言的前提下，使用labview訓練和部署深度學習模型，并配備相關案例視頻以及源碼。適用人群：1、適用于工業自動化行業從業者利用labview或者C#進行深度學習應用；2、適用于plc

2020-11-27 11:19:37

什么是深度學習？使用FPGA進行深度學習的好處？

）和網絡修剪，正在積極研究中，這些方法與 FPGA 非常兼容。也有FPGA供應商發布高速深度學習IP，以及配備適合深度學習計算的硬件的SoC型FPGA等利好因素。深度學習與FPGA的實際應用還有很長的路

2023-02-17 16:56:59

介紹在STM32cubeIDE上部署AI模型的系列教程

介紹在STM32cubeIDE上部署AI模型的系列教程，開發板型號STM32H747I-disco，值得一看。MCUAI原文鏈接:【嵌入式AI開發】篇四|部署篇：STM32cubeIDE上部署神經網絡之模型部署

2021-12-14 09:05:03

全網唯一一套labview深度學習教程：tensorflow+目標檢測：龍哥教你學視覺—LabVIEW深度學習教程

。比如本文討論的缺陷檢測，上面的很多網絡的特點，以及方法都給了我們很多的啟發，我們在設計網絡結構的時候，配合自己在產線部署的硬件性能，設計適合項目的網絡結構。當然，深度學習的方法用來檢測，也有自己的很多

2020-08-10 10:38:12

在FPGA上建立MATLAB和Simulink算法原型的四種最佳方法

ModelSim/Questa,收集代碼覆蓋率數據，以對生成的代碼加以全面分析。使用FPGA在環仿真加速驗證使用系統級仿真和HDL協同仿真驗證DDC算法之后，便可以立即在FPGA目標平臺上部署DDC

2020-05-04 07:00:00

在Arm虛擬硬件上部署PP-PicoDet模型

1、在Arm虛擬硬件上部署PP-PicoDet模型　　經典的深度學習工程是從確認任務目標開始的，我們首先來簡單地介紹一下目標檢測任務以及本期部署實戰課程中我們所使用的工具和平臺。　　目標檢測任務

2022-09-16 14:42:09

在Arm虛擬硬件上部署PP-PicoDet模型的設計方案

2022-09-23 15:02:59

在全志V853平臺上成功部署深度學習步態識別算法

的Pytorch 模型通過模型轉換工具轉換為V853 NPU所能運行的NB模型，模型的推理在NPU上進行。系統的整體運行過程分為前處理、模型推理、后處理與UI顯示四大部分。本系統所采用的深度學習算法

2024-03-04 10:15:03

基于深度神經網絡的激光雷達物體識別系統及其嵌入式平臺部署

2021-01-04 06:26:23

如何使用TensorFlow將神經網絡模型部署到移動或嵌入式設備上

有很多方法可以將經過訓練的神經網絡模型部署到移動或嵌入式設備上。不同的框架在各種平臺上支持Arm，包括TensorFlow、PyTorch、Caffe2、MxNet和CNTK，如Android

2023-08-02 06:43:57

如何在MIMXRT1064評估套件上部署tflite模型？

我有一個嬰兒哭聲檢測 tflite (tensorflow lite) 文件，其中包含模型本身。我如何將此模型部署到 MIMXRT1064-evk 以通過 MCUXpresso IDE 運行推理。你能推薦一些用于嬰兒哭聲檢測的教程和輸入數據集嗎？

2023-04-06 06:24:55

如何實現嵌入式平臺與深度學習的智能氣象監測儀器的設計

基于嵌入式平臺與深度學習的智能氣象監測儀器設計方案一、概述二、整體框架三、人工智能部分：四、嵌入式部分4.1安卓主控4.2協處理器五、人機交互一、概述以目前常見移動設備的存儲和計算能力，是不可能實現

2021-11-09 09:14:46

如何用Arm虛擬硬件在Arm Cortex-M上部署PaddlePaddle

學習編譯器。它主要用于解決在廣泛的硬件目標上部署各種深度學習框架的適應性問題。如圖 5 所示，TVM 編譯器接受由經典深度學習訓練框架（如PaddlePaddle）編寫的模型。然后將這些模型轉換為可以在

2022-09-02 14:48:31

已結束-【書籍評測活動NO.2】瑞芯微官方推薦，基于RK3399Pro與RK3588的深度學習實踐

何基于RK3399Pro搭建開發環境、訓練模型，以及進行模型的推理和部署，實踐內容涵蓋卷積神經網絡和循環神經網絡，包含圖像分類、目標檢測、語音識別等經典算法的應用。此外，本書包含了大量的深度學習案例，讀者可以通過簡單的命令

2023-02-16 14:24:49

當AI遇上FPGA會產生怎樣的反應

、LSTM以及強化學習網絡等算法在內的應用加速平臺和完整的生態系統。深度學習包含兩個計算環節，即線下訓練和線上推理環節。GPU在深度學習算法模型訓練上非常高效，但在推理時，一次性只能對于一個輸入項進行

2021-09-17 17:08:32

怎樣去驗證可部署目標硬件與軟件算法模型之間的算法性能一致性？

如何去設計一款合理的電子硬件解決方案，從而實現經濟有效的大規模生產與部署？怎樣去驗證可部署目標硬件與軟件算法模型之間的算法性能一致性？System Generator是什么?有什么功能？

2021-04-08 06:25:48

機器學習簡介與經典機器學習算法人才培養

經典機器學習算法介紹章節目標：機器學習是人工智能的重要技術之一，詳細了解機器學習的原理、機制和方法，為學習深度學習與遷移學習打下堅實的基礎。二、深度學習簡介與經典網絡結構介紹神經網絡簡介神經網絡組件簡介

2022-04-28 18:56:07

針對FPGA或ASIC部署的浮點算法

對FPGA進行編程或部署到ASIC。但是，如果Native Floating-Point超出了您的資源預算，有幾種方法可以減少資源使用，如下所示：使用HDL編碼器優化：資源共享和其他算法級優化支持本機浮點

2018-09-11 21:59:16

阿里深度學習的“金剛鉆”——千億特征XNN算法及其落地實踐

平臺三．XNN深度學習算法一．業務背景業務場景和機器學習的問題業務場景主要包括三個方面：（1）搜索：比如用戶在淘寶中輸入檢索詞，網站則會展示出相應寶貝信息的場景。（2）廣告：包括搜索廣告，精準定向廣告

2018-04-24 16:43:39

FPGA是深度學習的未來

FPGA是深度學習的未來，學習資料，感興趣的可以看看。

2016-10-26 15:29:04

深度學習算法有望在FPGA和超級計算機上運行

由NSF資助的一個研究項目，目前正在研究如何使用RDMA高性能連接器將深度學習算法在FPGA和跨系統之間運行；另一個由Andrew Ng和兩個超算專家牽頭的項目，則希望把模型放在超級計算機上，給它們一個Python接口。

2017-02-10 16:32:30

744

深度學習算法聯合綜述

關于深度學習神經網絡算法的介紹，包含有對幾種神經網絡模型的詳細描述

2017-07-10 16:49:12

國內首款FPGA云服務器的深度學習算法背景及算法分析

由騰訊云基礎產品中心、騰訊架構平臺部組成的騰訊云FPGA聯合團隊，在這里介紹國內首款FPGA云服務器的工程實現深度學習算法（AlexNet），討論深度學習算法FPGA硬件加速平臺的架構

2017-11-15 20:20:08

2468

基于深度學習的多尺幅深度網絡監督模型

針對場景標注中如何產生良好的內部視覺信息表達和有效利用上下文語義信息兩個至關重要的問題，提出一種基于深度學習的多尺度深度網絡監督模型。與傳統多尺度方法不同，模型主要由兩個深度卷積網絡組成：首先網絡

2017-11-28 14:22:10

改進深度學習算法的光伏出力預測方法

為提高光伏出力的預測精度，提出了一種改進深度學習算法的光伏出力預測方法。首先，針對傳統的深度學習算法采用批量梯度下降（batch gradient descent，BGD）法訓練模型參數速度慢

2017-12-17 10:42:45

山世光談深度學習生產線、以及中科視拓深度學習算法平臺SeeTaaS

中科視拓董事長山世光研究員，在2017鈦媒體T-EDGE年度國際盛典上，談深度學習生產線、以及中科視拓通用深度學習算法平臺SeeTaaS。

2017-12-26 13:41:37

4266

隨機塊模型學習算法

的一個主要挑戰．提出一種精細隨機塊模型及其快速學習算法，該學習方法基于提出的模型與最小消息長度推導出一個新成本函數，利用期望最大化參數估計方法，實現了邊評價模型邊估計參數的并行學習策略。以此方式顯著降低隨機塊模

2018-01-09 18:20:04

模型驅動深度學習的標準流程與學習方法解析

模型驅動的深度學習方法近年來，深度學習在人工智能領域一系列困難問題上取得了突破性成功應用。

2018-01-24 11:30:13

4607

深度學習方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學習的研究者都在使用GPU，但是對比深度學習硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認清對深度學習硬件平臺的要求。

2018-02-02 15:21:40

10203

根據美團“猜你喜歡”來深度學習排序模型實踐

本文將主要介紹深度學習模型在美團平臺推薦排序場景下的應用和探索。

2018-04-02 09:35:24

6070

基于深度學習模型的點云目標檢測及ROS實現

近年來，隨著深度學習在圖像視覺領域的發展，一類基于單純的深度學習模型的點云目標檢測方法被提出和應用，本文將詳細介紹其中一種模型——SqueezeSeg，并且使用ROS實現該模型的實時目標檢測。

2018-11-05 16:47:29

17180

針對線性回歸模型和深度學習模型，介紹了確定訓練數據集規模的方法

具體來看，對于傳統的機器學習算法，模型的表現先是遵循冪定律（power law），之后趨于平緩；而對于深度學習，該問題還在持續不斷地研究中，不過圖一為目前較為一致的結論，即隨著數據規模的增長，深度

2019-05-05 11:03:31

5747

深度學習模型壓縮與加速綜述

目前在深度學習領域分類兩個派別，一派為學院派，研究強大、復雜的模型網絡和實驗方法，為了追求更高的性能；另一派為工程派，旨在將算法更穩定、高效的落地在硬件平臺上，效率是其追求的目標。復雜的模型固然具有

2019-06-08 17:26:00

4836

FPGA在深度學習領域的應用

本文從硬件加速的視角考察深度學習與FPGA，指出有哪些趨勢和創新使得這些技術相互匹配，并激發對FPGA如何幫助深度學習領域發展的探討。

2019-06-28 17:31:46

6529

微軟最新發布FPGA深度學習云平臺

微軟發布了 Project Brainwave，一個基于 FPGA 的低延遲深度學習云平臺。微軟官方測評顯示，當使用英特爾的 Stratix 10 FPGA，Brainwave 不需要任何

2019-07-03 14:58:52

883

深度學習模型小型化處理的五種方法

現在深度學習模型開始走向應用，因此我們需要把深度學習網絡和模型部署到一些硬件上，而現有一些模型的參數量由于過大，會導致在一些硬件上的運行速度很慢，所以我們需要對深度學習模型進行小型化處理。

2020-01-28 17:40:00

3657

『 RJIBI 』-基于FPGA的YOLO-V3物體識別計算套件

的軟件部署方法（2）針對MPSOC FPGA平臺的YOLOV-V3算法和相關接口的硬件實現和部署流程。主要指標（1）FPGA硬件計算平臺為 RJIBI FACE系列板卡套件（2）深度學習訓練框架

2020-05-19 10:22:58

13976

百度聯合米爾推出基于FPGA可伸縮計算架構的FZ3深度學習計算卡

（及Video Decode）的架構，既具有多核處理能力、也有視頻流硬解碼處理能力，還具有FPGA的可編程的特點。內置Linux 4.14.0系統和深度學習預裝環境，與百度大腦模型定制平臺（AIStudio、EasyDL、EasyEdge）深度打通，實現模型的訓練、部署、推理等一站式服務。

2020-03-31 17:02:42

3388

百度飛槳深度學習平臺攜手IC設計領導廠商MediaTek

百度飛槳是自主研發、開源開放、功能最完備的產業級深度學習平臺，集深度學習核心框架、基礎模型庫、端到端開發套件、工具組件和服務平臺于一體，包含完整的開發、訓練、推理的端到端深度學習AI模型開發工具鏈。

2020-05-29 14:59:40

2667

如何系統型的學習深度學習？

更要命的是，我發現我一直都是在寫算法，從沒考慮過如何部署模型，也就是整天紙上談兵。所以我最近開始學網絡知識，學習什么是客戶機服務器模式，學習flask，想把自己的模型部署到web服務器上。

2020-10-10 10:39:49

2566

愛奇藝深度學習平臺對TF Serving毛刺問題的優化

決這個問題，愛奇藝深度學習平臺團隊經過多個階段的優化實踐，最后對 TF Serving 和 TensorFlow 的源碼進行深入優化，將模型熱更新時的毛刺現象解決，本文將分享 TensorFlow

2020-12-17 16:48:47

3930

新型基于深度學習的目標實時跟蹤算法

　　針對基于深度學習的目標跟蹤算法模型參數多、難以部署于嵌入式設備上的問題，提出一種改進的孿生卷積網絡實時目標跟蹤算法。設計一個非對稱卷積模塊來構建整個網絡框架，通過非對稱卷積模塊的壓縮層減少模型

2021-03-11 10:41:04

基于深度學習的視頻質量評價方法及模型研究

視頻質量評價（VQA）是以人眼的主觀質量評估結果為依據，使用算法模型對失真視頻進行評估。傳統的評估方法難以做到主觀評價結果與客觀評價結果相一致。基于深度學習的視頻質量評價方法無需加入手工特征，通過

2021-03-29 15:46:40

FPGA上部署深度學習的算法模型的方法以及平臺

今天給大家介紹一下FPGA上部署深度學習的算法模型的方法以及平臺。希望通過介紹，算法工程師在FPGA的落地上能“稍微”緩和一些，小白不再那么迷茫。阿chai最近在肝一個開源的項目，等忙完了會給大家

2021-06-10 17:32:36

3141

結合基擴展模型和深度學習的信道估計方法

2021-06-30 10:43:39

移植深度學習算法模型到海思AI芯片

本文大致介紹將深度學習算法模型移植到海思AI芯片的總體流程和一些需要注意的細節。海思芯片移植深度學習算法模型，大致分為模型轉換，...

2022-01-26 19:42:35

如何為深度學習模型設計審計方案

　　在本文中，我們開發了一個深度學習（ DL ）模型審計框架。越來越多的人開始關注 DL 模型中的固有偏見，這些模型部署在廣泛的環境中，并且有多篇關于部署前審核 DL 模型的必要性的新聞文章。我們的框架將這個審計問題形式化，我們認為這是在部署期間提高 DL 模型的安全性和道德使用的一個步驟。

2022-04-19 14:50:24

1083

基于深度學習算法的軟件生態系統

模型快速的部署到TI嵌入式平臺。 TDA4擁有TI最新一代的深度學習加速模塊C7x DSP與MMA矩陣乘法加速器，可以運行TIDL進行卷積等基本計算，從而快速地進行前向推理，得到計算結果。當深度學習遇上TDA4，你的模型部署流程將變得簡單，你的模型將高效地運行在TDA4上。

2022-06-30 17:01:21

1741

深度學習模型的部署方法

分享的內容，部署模型需要考慮哪些問題，考慮哪些步驟及現在常用的部署方法！今天內容較多，感興趣的請收藏慢慢閱讀！

2022-12-01 11:30:36

1681

深度學習聚類的綜述

作者：凱魯嘎吉來源：博客園這篇文章對現有的深度聚類算法進行全面綜述與總結。現有的深度聚類算法大都由聚類損失與網絡損失兩部分構成，博客從兩個視角總結現有的深度聚類算法，即聚類模型與神經網絡模型

2022-12-30 11:15:08

648

什么是深度學習中優化算法

先大致講一下什么是深度學習中優化算法吧，我們可以把模型比作函數，一種很復雜的函數：h(f(g(k(x))))，函數有參數，這些參數是未知的，深度學習中的“學習”就是通過訓練數據求解這些未知的參數。

2023-02-13 15:31:48

1016

大模型為什么是深度學習的未來？

與傳統機器學習相比，深度學習是從數據中學習，而大模型則是通過使用大量的模型來訓練數據。深度學習可以處理任何類型的數據，例如圖片、文本等等；但是這些數據很難用機器完成。大模型可以訓練更多類別、多個級別的模型，因此可以處理更廣泛的類型。另外：在使用大模型時，可能需要一個更全面或復雜的數學和數值計算的支持。

2023-02-16 11:32:37

1605