有声小说下载,盗墓笔记小说下载,欢乐颂第一季

引言

網(wǎng)絡壓縮在AI加速中可以說起到“四兩撥千斤”的作用，網(wǎng)絡參數(shù)的減小不僅僅降低了存儲和帶寬，而且使計算邏輯簡單，降低了LUT資源。從本篇開始，我們就一起挖掘一下網(wǎng)絡壓縮算法的類型，原理，實現(xiàn)，以及效果。寫這類算法類文章，一是學習，二是希望能夠令更多做FPGA的人，不再將眼光局限于RTL，仿真，調試，關心一下算法，定會發(fā)現(xiàn)FPGA的趣味和神通。

網(wǎng)絡結構

二值化網(wǎng)絡，顧名思義，就是網(wǎng)絡參數(shù)只有兩個數(shù)值，這兩個數(shù)值是+1和-1。在DNN網(wǎng)絡中主要是乘和加法運算，如果參數(shù)只有兩個數(shù)值，那么乘法的實現(xiàn)就很簡單，僅僅需要符號判斷就可以了。比如輸入數(shù)據(jù)A，如果和1乘，不變；和-1乘，變?yōu)樨摂?shù)。這用LUT很好實現(xiàn)，還節(jié)省了DSP的使用。相對于單精度浮點數(shù)，存儲減小16倍，帶寬也增加16倍。在計算單元數(shù)目相同情況下，比浮點運算速率提高了16倍。當然由于乘法和加法使用LUT數(shù)目減少，計算單元也會成倍增長，總的下來計算速率將大幅度提高。

網(wǎng)絡訓練中使用的都是浮點類型參數(shù)，這樣做是為了保證訓練的精度。那么這些浮點類型的參數(shù)如何量化的只有兩個數(shù)值呢？論文中提出了兩種方法，第一種是粗暴型，直接根據(jù)權重參數(shù)的正負，強行分出1和-1。即：

這里wb是二值參數(shù)，w是實際權重參數(shù)。量化可以看做在原來數(shù)據(jù)基礎上增加了噪聲，導致數(shù)據(jù)間最短距離變大。比如原來數(shù)據(jù)的分辨率為R0，如果增加一個高斯噪聲s，那么其分辨率就增大了。這樣在DNN中矩陣乘法中也引入了噪聲，為：

數(shù)據(jù)分辨率的降低導致了有效信息的損失，但是在大量權重情形下，平均下來可以補償一定的信息損失，即如果有：

那么在權重無窮多時，有：

圖1.1 數(shù)據(jù)增加了噪聲，導致數(shù)據(jù)分辨率降低

另外一種是隨機型，即以一定概率來選擇1和-1，論文中采用如下公式：

其中“hard sigmoid”函數(shù)為：

這實際上是對sigmoid函數(shù)進行了線性化，這樣做的目的可以減少計算量。因為線性計算只有一個乘法和加法，而sigmoid函數(shù)有指數(shù)計算。使用隨機量化更能均衡化量化引入的噪聲，消除噪聲造成的信息損失。粗暴型量化可能因為權重參數(shù)分布不同而發(fā)生較大的“不平衡”，比如負數(shù)權重較多，那么導致-1遠遠多于+1，這樣就會出現(xiàn)權重偏移在負方向多一些。如果使用隨機概率模型，即使負數(shù)權重多，也會有一定概率出現(xiàn)+1，彌補了+1較少的情況。