听中国有声小说,琅琊榜海宴小说,琅琊榜海宴小说

之前介紹的項目《優秀的 Verilog/FPGA開源項目介紹（十四）- 使用FPGA實現LeNet-5 深度神經網絡模型》最后我們分析了，純FPGA實現神經網絡的缺點，以及現在FPGA廠家的加速方案，這里引用一下：

到底純FPGA適不適合這種大型神經網絡的設計？這個問題其實我們不適合回答，但是FPGA廠商是的實際操作是很有權威性的，現在不論是Intel還是Xilinx都沒有在自己傳統的FPGA上推廣AI，都是在基于FPGA的SoC上推廣（Vitis和OpenVINO，前者Xilinx后者Intel），總結來看就是：純 RTL 硬件設計不是AI的好選擇。特別是對于大規模網絡，權重和中間結果需要存儲在外部存儲器中。并且數據迭代器會更加復雜。設計周期長，AI相關領域迭代速度快，綜上以上幾點，可以很容易給你們指引一條道路。

目前主流的解決方案就是使用通用或專用處理器來做控制工作，讓硬件來執行計算（加速的概念），今天就介紹兩個針對以上解決方案的開源項目，這兩個項目是用FPGA進行硬件加速的必備項目。

AI算法流程

在進行項目介紹前，我們先介紹一下軟件架構和工具集。這個后面會影響理解。

一個完整的深度學習框架中主要分為下面幾個流程：

有一些是我們不太關心的部分（對于FPGA實現應用），即數據收集等，所以上訴流程再簡單分為幾個主要部分，即訓練（training）和推理（inference）、部署（deployment）。

訓練（Training）

使用訓練模型（Caffe、TensorFlow、MxNET、ONNX等）根據訓練數據得到相關的參數。舉個例子，我現在想要設備識別貓和狗，我首先需要收集貓和狗的圖片（這些圖片稱為訓練數據集（training dataset）），但是這些數據集在進行訓練前要有標簽（即每張照片是狗，那張照片是貓），選擇好訓練模型后，將上訴數據給訓練模型進行訓練，訓練模型不是萬能的，雖然能通過訓練不斷的優化參數，但是在訓練完還不一定能達到你想要的識別率（比如100張圖片有50張能識別），接下來就是通過優化參數，讓另外50張錯的也變成對的。這整個過程就稱之為訓練（Traning）。

推理（Inference）

這個過程比較簡單，就是把上面訓練好的模型，去識別不是訓練集里的圖片（這種圖片就叫做現場數據（live data）），如果對這些現場數據的識別也非常NICE，那么證明你的網絡訓練的是非常好的，如果不是特別好，就需要把訓練數據集增加，重復這一過程，直到現場數據也達到比較好的效果。把訓練好的模型拿出來進行現場實驗推理的過程，稱為推理（Inference）。

部署（deployment）

部署的理解很簡單，就是經過上面兩個步驟的模型應用，把它放在某個硬件平臺上運行，這個過程稱之為部署（deployment）。

其實各大廠家推出自己的架構/工具都是基于上訴流程，不同點就是會針對自家的硬件做細節優化。

現在常見的模型推理部署框架有很多，比如：英特爾的OpenVINO，英偉達的TensorRT,谷歌的Mediapipe，Xilinx Vitis。

Intel FPGA OpenVINO

介紹

OpenVINO是Intel推出的用于優化和部署 AI 推理的開源工具包。

提升計算機視覺、自動語音識別、自然語言處理和其他常見任務中的深度學習性能

使用通過 TensorFlow、PyTorch 等流行框架訓練的模型

減少資源需求并在從邊緣到云的一系列英特爾平臺上高效部署

來源：知乎@火狐貍

上圖就是OpenVINO的組成，針對第一節的 AI算法流程理解起來不是很難。其中，模型優化器是線下模型轉換，推理引擎是部署在設備上運行的AI負載。

因為OpenVINO還有針對自己CPU的架構，沒有對FPGA部分過多介紹，所以一些細節會在下一個項目介紹。

視頻介紹

關于OpenFPGA在FPGA方面的加速應用，可以查看下面的兩個官方中文視頻介紹，這里就不再贅述。

Xilinx FPGA Vitis AI

2019年10月，Xilinx正式發布了統一開發軟件平臺Vitis。Vitis平臺無需用戶深入掌握硬件專業知識，即軟件和算法自動適配到Xilinx的硬件架構。Xilinx Vitis AI是針對自家硬件平臺推出的針對AI模型的硬件實現。Vitis AI 提供的工具鏈能在數分鐘內完成優化、量化和編譯操作，在賽靈思器件上高效地運行預先訓練好的AI模型。

介紹