CNN模型思路、加速算法設計及其實驗樣例 - 全文

自從AlexNet一舉奪得ILSVRC 2012 ImageNet圖像分類競賽的冠軍后，卷積神經網絡（CNN）的熱潮便席卷了整個計算機視覺領域。CNN模型火速替代了傳統人工設計（hand-crafted）特征和分類器，不僅提供了一種端到端的處理方法，還大幅度地刷新了各個圖像競賽任務的精度，更甚者超越了人眼的精度（LFW人臉識別任務）。CNN模型在不斷逼近計算機視覺任務的精度極限的同時，其深度和尺寸也在成倍增長。
?

表1 幾種經典模型的尺寸，計算量和參數數量對比

Model Model Size(MB) Million
Mult-Adds Million
Parameters
AlexNet[1]?>200?720?60?
VGG16[2]?>500?15300?138?
GoogleNet[3]?~50?1550?6.8?
Inception-v3[4]?90-100?5000?23.2

隨之而來的是一個很尷尬的場景：如此巨大的模型只能在有限的平臺下使用，根本無法移植到移動端和嵌入式芯片當中。就算想通過網絡傳輸，但較高的帶寬占用也讓很多用戶望而生畏。另一方面，大尺寸的模型也對設備功耗和運行速度帶來了巨大的挑戰。因此這樣的模型距離實用還有一段距離。

在這樣的情形下，模型小型化與加速成了亟待解決的問題。其實早期就有學者提出了一系列CNN模型壓縮方法，包括權值剪值（prunning）和矩陣SVD分解等，但壓縮率和效率還遠不能令人滿意。

近年來，關于模型小型化的算法從壓縮角度上可以大致分為兩類：從模型權重數值角度壓縮和從網絡架構角度壓縮。另一方面，從兼顧計算速度方面，又可以劃分為：僅壓縮尺寸和壓縮尺寸的同時提升速度。

本文主要討論如下幾篇代表性的文章和方法，包括SqueezeNet[5]、Deep Compression[6]、XNorNet[7]、Distilling[8]、MobileNet[9]和ShuffleNet[10]，也可按照上述方法進行大致分類：

表2 幾種經典壓縮方法及對比

Method Compression Approach Speed Consideration
SqueezeNet?architecture?No?
Deep Compression?weights?No?
XNorNet?weights?Yes?
Distilling?architecture?No?
MobileNet?architecture?Yes?
ShuffleNet?architecture?Yes

一、SqueezeNet

1.1 設計思想

SqueezeNet是F. N. Iandola,S.Han等人于2016年的論文《SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and < 0.5MB model size》中提出的一個小型化的網絡模型結構，該網絡能在保證不損失精度的同時，將原始AlexNet壓縮至原來的510倍左右（< 0.5MB）。

SqueezeNet的核心指導思想是——在保證精度的同時使用最少的參數。

而這也是所有模型壓縮方法的一個終極目標。

基于這個思想，SqueezeNet提出了3點網絡結構設計策略：

策略 1.將3x3卷積核替換為1x1卷積核。

這一策略很好理解，因為1個1x1卷積核的參數是3x3卷積核參數的1/9，這一改動理論上可以將模型尺寸壓縮9倍。

策略 2.減小輸入到3x3卷積核的輸入通道數。

我們知道，對于一個采用3x3卷積核的卷積層，該層所有卷積參數的數量（不考慮偏置）為：

式中，N是卷積核的數量，也即輸出通道數，C是輸入通道數。

因此，為了保證減小網絡參數，不僅僅需要減少3x3卷積核的數量，還需減少輸入到3x3卷積核的輸入通道數量，即式中C的數量。

策略 3.盡可能的將降采樣放在網絡后面的層中。

在卷積神經網絡中，每層輸出的特征圖（feature map）是否下采樣是由卷積層的步長或者池化層決定的。而一個重要的觀點是：分辨率越大的特征圖（延遲降采樣）可以帶來更高的分類精度，而這一觀點從直覺上也可以很好理解，因為分辨率越大的輸入能夠提供的信息就越多。

上述三個策略中，前兩個策略都是針對如何降低參數數量而設計的，最后一個旨在最大化網絡精度。

1.2 網絡架構

基于以上三個策略，作者提出了一個類似inception的網絡單元結構，取名為fire module。一個fire module 包含一個squeeze 卷積層（只包含1x1卷積核）和一個expand卷積層（包含1x1和3x3卷積核）。其中，squeeze層借鑒了inception的思想，利用1x1卷積核來降低輸入到expand層中3x3卷積核的輸入通道數。如圖1所示。

圖1 Fire module結構示意圖

其中，定義squeeze層中1x1卷積核的數量是s1x1，類似的，expand層中1x1卷積核的數量是e1x1， 3x3卷積核的數量是e3x3。令s1x1 < e1x1+ e3x3從而保證輸入到3x3的輸入通道數減小。SqueezeNet的網絡結構由若干個 fire module 組成，另外文章還給出了一些架構設計上的細節：

為了保證1x1卷積核和3x3卷積核具有相同大小的輸出，3x3卷積核采用1像素的zero-padding和步長
squeeze層和expand層均采用RELU作為激活函數
在fire9后采用50%的dropout
由于全連接層的參數數量巨大，因此借鑒NIN[11]的思想，去除了全連接層而改用global average pooling。

1.3 實驗結果

表3 不同壓縮方法在ImageNet上的對比實驗結果[5]

CNN模型思路、加速算法設計及其實驗樣例

上表顯示，相比傳統的壓縮方法，SqueezeNet能在保證精度不損（甚至略有提升）的情況下，達到最大的壓縮率，將原始AlexNet從240MB壓縮至4.8MB，而結合Deep Compression后更能達到0.47MB，完全滿足了移動端的部署和低帶寬網絡的傳輸。

此外，作者還借鑒ResNet思想，對原始網絡結構做了修改，增加了旁路分支，將分類精度提升了約3%。

1.4 速度考量

盡管文章主要以壓縮模型尺寸為目標，但毋庸置疑的一點是，SqueezeNet在網絡結構中大量采用1x1和3x3卷積核是有利于速度的提升的，對于類似caffe這樣的深度學習框架，在卷積層的前向計算中，采用1x1卷積核可避免額外的im2col操作，而直接利用gemm進行矩陣加速運算，因此對速度的優化是有一定的作用的。然而，這種提速的作用仍然是有限的，另外，SqueezeNet采用了9個fire module和兩個卷積層，因此仍需要進行大量常規卷積操作，這也是影響速度進一步提升的瓶頸。

二、Deep Compression

Deep Compression出自S.Han 2016 ICLR的一篇論文《Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding》。該文章獲得了ICLR 2016的最佳論文獎，同時也具有里程碑式的意義，引領了CNN模型小型化與加速研究方向的新狂潮，使得這一領域近兩年來涌現出了大量的優秀工作與文章。

2.1 算法流程

與前面的“架構壓縮派”的SqueezeNet不同，Deep Compression是屬于“權值壓縮派”的。而兩篇文章均出自S.Han團隊，因此兩種方法結合，雙劍合璧，更是能達到登峰造極的壓縮效果。這一實驗結果也在上表中得到驗證。

Deep Compression的算法流程包含三步，如圖2所示：

圖2 Deep Compression Pipeline

1、Pruning(權值剪枝)

剪枝的思想其實早已在早期論文中可以窺見，LeCun等人曾經就利用剪枝來稀疏網絡，減小過擬合的風險，提升網絡泛化性。

圖3是MNIST上訓練得到的LeNet conv1卷積層中的參數分布，可以看出，大部分權值集中在0處附近，對網絡的貢獻較小，在剪值中，將0值附近的較小的權值置0，使這些權值不被激活，從而著重訓練剩下的非零權值，最終在保證網絡精度不變的情況下達到壓縮尺寸的目的。

實驗發現模型對剪枝更敏感，因此在剪值時建議逐層迭代修剪，另外每層的剪枝比例如何自動選取仍然是一個值得深入研究的課題。

圖3 LeNet conv1層權值分布圖

2、Quantization (權值量化)

此處的權值量化基于權值聚類，將連續分布的權值離散化，從而減小需要存儲的權值數量。

初始化聚類中心，實驗證明線性初始化效果最好；

利用k-means算法進行聚類，將權值劃分到不同的cluster中；

在前向計算時，每個權值由其聚類中心表示；

在后向計算時，統計每個cluster中的梯度和將其反傳。

圖4 權值量化前向和后向計算過程

3、Huffman encoding(霍夫曼編碼)

霍夫曼編碼采用變長編碼將平均編碼長度減小，進一步壓縮模型尺寸。

2.2 模型存儲

前述的剪枝和量化都是為了實現模型的更緊致的壓縮，以實現減小模型尺寸的目的。

對于剪枝后的模型，由于每層大量參數為0，后續只需將非零值及其下標進行存儲，文章中采用CSR（Compressed Sparse Row）來進行存儲，這一步可以實現9x~13x的壓縮率。

對于量化后的模型，每個權值都由其聚類中心表示（對于卷積層，聚類中心設為256個，對于全連接層，聚類中心設為32個），因此可以構造對應的碼書和下標，大大減少了需要存儲的數據量，此步能實現約3x的壓縮率。

最后對上述壓縮后的模型進一步采用變長霍夫曼編碼，實現約1x的壓縮率。

2.3 實驗結果

表4 不同網絡采用Deep Compression后的壓縮率

CNN模型思路、加速算法設計及其實驗樣例

通過SqueezeNet+Deep Compression,可以將原始240M的AlexNet壓縮至0.47M，實現約510x的壓縮率。

2.4 速度考量

可以看出，Deep Compression的主要設計是針對網絡存儲尺寸的壓縮，但在前向時，如果將存儲模型讀入展開后，并沒有帶來更大的速度提升。因此Song H.等人專門針對壓縮后的模型設計了一套基于FPGA的硬件前向加速框架EIE[12]，有興趣的可以研究一下。

三、XNorNet

二值網絡一直是模型壓縮和加速領域經久不衰的研究課題之一。將原始32位浮點型的權值壓縮到1比特，如何最大程度地減小性能損失就成為了研究的關鍵。

此篇論文主要有以下幾個貢獻：

提出了一個BWN（Binary-Weight-Network）和XNOR-Network，前者只對網絡參數做二值化，帶來約32x的存儲壓縮和2x的速度提升，而后者對網絡輸入和參數都做了二值化，在實現32x存儲壓縮的同時帶了58x的速度提升；
提出了一個新型二值化權值的算法；
第一個在大規模數據集如ImageNet上提交二值化網絡結果的工作；
無需預訓練，可實現training from scratch。

3.1 BWN

CNN模型思路、加速算法設計及其實驗樣例

即最優的二值化濾波器張量B即為原始參數的符號函數，最優的尺度因子為每個濾波器權值的絕對值的均值。

訓練算法如圖5所示，值得注意的是，只有在前向計算和后向傳播時使用二值化后的權值，在更新參數時依然使用原始參數，這是因為如果使用二值化后的參數會導致很小的梯度下降，從而使得訓練無法收斂。

3.2 XNOR-Net

在XNOR網絡中，優化的目標是將兩個實數向量的點乘近似到兩個二值向量的點乘，即

CNN模型思路、加速算法設計及其實驗樣例

在卷積計算中，輸入和權值均量化成了二值，因此傳統的乘法計算變成了異或操作，而非二值化數據的計算只占了很小一部分。

XNOR-Net中一個典型的卷積單元如圖6所示，與傳統單元不同，各模塊的順序有了調整。為了減少二值化帶來的精度損失，對輸入數據首先進行BN歸一化處理，BinActiv層用于對輸入做二值化，接著進行二值化的卷積操作，最后進行pooling。

圖5 BWN訓練過程

圖6 傳統卷積單元與XNOR-Net卷積單元對比

3.3 實驗結果

表5 ImageNet上二值網絡與AlexNet結果對比

與ALexNet相比，BWN網絡能夠達到精度基本不變甚至略好，XNOR-Net由于對輸入也做了二值化，性能稍降。

四、Distilling

Distilling算法是Hinton等人在論文Distilling the Knowledge in a Neural Network中提出的一種類似網絡遷移的學習算法。

4.1 基本思想

Distilling直譯過來即蒸餾，其基本思想是通過一個性能好的大網絡來教小網絡學習，從而使得小網絡能夠具備跟大網絡一樣的性能，但蒸餾后的小網絡參數規模遠遠小于原始大網絡，從而達到壓縮網絡的目的。

其中，訓練小模型(distilled model)的目標函數由兩部分組成

1) 與大模型(cumbersome model)的softmax輸出的交叉熵(cross entropy)，稱為軟目標(soft target)。其中，softmax的計算加入了超參數溫度T，用以控制輸出，計算公式變為

溫度T越大，輸出的分布越緩和，概率zi/T越小，熵越大，但若T過大，會導致較大熵引起的不確定性增加，增加了不可區分性。

至于為何要以soft target來計算損失，作者認為，在分類問題中，真值(groundtruth)是一個確定性的，即one-hot vector。以手寫數字分類來說，對于一個數字3，它的label是3的概率是1，而是其他數值的概率是0，而對于soft target，它能表征label是3的概率，假如這個數字寫的像5，還可以給出label是5的一定概率，從而提供更多信息，如

數字 0 1 2 3 4 5 6 7 8 9
真值?0?0?0?1?0?0?0?0?0?0?
軟目標?0?0?0?0.95?0?0.048?0.002?0?0?0

2)與真值(groundtruth)的交叉熵(T=1)

訓練的損失為上述兩項損失的加權和，通常第二項要小很多。

4.2 實驗結果

作者給出了在語音識別上的實驗結果對比，如下表

表6 蒸餾模型與原始模型精度對比[8]

上表顯示，蒸餾后的模型的精確度和單字錯誤率和用于產生軟目標的10個模型的性能相當，小模型成功地學到了大模型的識別能力。

4.3 速度考量

Distilling的提出原先并非針對網絡加速，而最終計算的效率仍然取決于蒸餾模型的計算規模，但理論上蒸餾后的小模型相對原始大模型的計算速度在一定程度上會有提升，但速度提升的比例和性能維持的權衡是一個值得研究的方向。

五、MobileNet

MobileNet是由Google提出的針對移動端部署的輕量級網絡架構。考慮到移動端計算資源受限以及速度要求嚴苛，MobileNet引入了傳統網絡中原先采用的group思想，即限制濾波器的卷積計算只針對特定的group中的輸入，從而大大降低了卷積計算量，提升了移動端前向計算的速度。

5.1 卷積分解

MobileNet借鑒factorized convolution的思想，將普通卷積操作分成兩部分：

Depthwise Convolution

每個卷積核濾波器只針對特定的輸入通道進行卷積操作，如下圖所示，其中M是輸入通道數，DK是卷積核尺寸：

圖7 Depthwise Convolution

Depthwise convolution的計算復雜度為 DKDKMDFDF，其中DF是卷積層輸出的特征圖的大小。

Pointwise Convolution
采用1x1大小的卷積核將depthwise convolution層的多通道輸出進行結合，如下圖，其中N是輸出通道數：

圖8 Pointwise Convolution

圖8 Pointwise Convolution[

Pointwise Convolution的計算復雜度為 MNDFDF

上面兩步合稱depthwise separable convolution

標準卷積操作的計算復雜度為DKDKMNDFDF

因此，通過將標準卷積分解成兩層卷積操作，可以計算出理論上的計算效率提升比例：

對于3x3尺寸的卷積核來說，depthwise separable convolution在理論上能帶來約8～9倍的效率提升。

5.2 模型架構

圖9 普通卷積單元與MobileNet 卷積單元對比

MobileNet的卷積單元如上圖所示，每個卷積操作后都接著一個BN操作和ReLU操作。在MobileNet中，由于3x3卷積核只應用在depthwise convolution中，因此95%的計算量都集中在pointwise convolution 中的1x1卷積中。而對于caffe等采用矩陣運算GEMM實現卷積的深度學習框架，1x1卷積無需進行im2col操作，因此可以直接利用矩陣運算加速庫進行快速計算，從而提升了計算效率。

5.3 實驗結果

表7 MobileNet與主流大模型在ImageNet上精度對比

CNN模型思路、加速算法設計及其實驗樣例

上表顯示，MobileNet在保證精度不變的同時，能夠有效地減少計算操作次數和參數量，使得在移動端實時前向計算成為可能。

六、ShuffleNet

ShuffleNet是Face++今年提出了一篇用于移動端前向部署的網絡架構。ShuffleNet基于MobileNet的group思想，將卷積操作限制到特定的輸入通道。而與之不同的是，ShuffleNet將輸入的group進行打散，從而保證每個卷積核的感受野能夠分散到不同group的輸入中，增加了模型的學習能力。

6.1 設計思想

我們知道，卷積中的group操作能夠大大減少卷積操作的計算次數，而這一改動帶來了速度增益和性能維持在MobileNet等文章中也得到了驗證。然而group操作所帶來的另一個問題是：特定的濾波器僅對特定通道的輸入進行作用，這就阻礙了通道之間的信息流傳遞，group數量越多，可以編碼的信息就越豐富，但每個group的輸入通道數量減少，因此可能造成單個卷積濾波器的退化，在一定程度上削弱了網絡了表達能力。

6.2 網絡架構

在此篇工作中，網絡架構的設計主要有以下幾個創新點：

提出了一個類似于ResNet的BottleNeck單元
借鑒ResNet的旁路分支思想，ShuffleNet也引入了類似的網絡單元。不同的是，在stride=2的單元中，用concat操作代替了add操作，用average pooling代替了1x1stride=2的卷積操作，有效地減少了計算量和參數。單元結構如圖10所示。

提出將1x1卷積采用group操作會得到更好的分類性能
在MobileNet中提過，1x1卷積的操作占據了約95%的計算量，所以作者將1x1也更改為group卷積，使得相比MobileNet的計算量大大減少。

提出了核心的shuffle操作將不同group中的通道進行打散，從而保證不同輸入通道之間的信息傳遞。

ShuffleNet的shuffle操作如圖11所示。

圖10 ShuffleNet網絡單元

圖11 不同group間的shuffle操作

6.3 實驗結果

表8 ShuffleNet與MobileNet在ImageNet上精度對比

CNN模型思路、加速算法設計及其實驗樣例

上表顯示，相對于MobileNet，ShuffleNet的前向計算量不僅有效地得到了減少，而且分類錯誤率也有明顯提升，驗證了網絡的可行性。

6.4 速度考量

作者在ARM平臺上對網絡效率進行了驗證，鑒于內存讀取和線程調度等因素，作者發現理論上4x的速度提升對應實際部署中約2.6x。作者給出了與原始AlexNet的速度對比，如下表。

表9 ShuffleNet與AlexNet在ARM平臺上速度對比 [10]

CNN模型思路、加速算法設計及其實驗樣例

結束語

近幾年來，除了學術界涌現的諸多CNN模型加速工作，工業界各大公司也推出了自己的移動端前向計算框架，如Google的Tensorflow、Facebook的caffe2以及蘋果今年剛推出的CoreML。相信結合不斷迭代優化的網絡架構和不斷發展的硬件計算加速技術，未來深度學習在移動端的部署將不會是一個難題。

參考文獻

[1] ImageNet Classification with Deep Convolutional Neural Networks

[2] Very Deep Convolutional Networks for Large-Scale Image Recognition

[3] Going Deeper with Convolutions

[4] Rethinking the Inception Architecture for Computer Vision

[5] SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and < 0.5MB model size

[6] Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

[7] Distilling the Knowledge in a Neural Network

[8] XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks

[9] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

[10] ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

[11] Network in Network

[12] EIE: Efficient Inference Engine on Compressed Deep Neural Network

閱讀全文

上一頁 1 2 3 4 5全文

本文導航

計算機視覺(45543) 計算機視覺(45543)
cnn(21235) cnn(21235)

一種超級實用的步進電機調速算法

今天想分享一種超級實用的步進電機調速算法，這種算法在步進電機調速方案中可以說是一種非常優異的方案。

2022-07-20 09:39:59

2269

*的步進電機調速算法**~ 精選資料推薦

[導讀] 大家好，我是逸珺。今天想分享一種超級實用的步進電機調速算法，這種算法在步進電機調速方案中可以說是一種非常優異的方案。梯形調速算法 為啥需要設計一個調速算法呢？步進電機不是給多少脈...

2021-09-01 07:53:17

加速度計和陀螺儀的數學模型和基本算法是什么？如何進行融合？

2021-11-12 07:15:08

ADC0804工作原理及其實現方式是什么

ADC分為哪幾種？ADC的參數指標有哪些？ADC0804工作原理及其實現方式是什么？

2021-08-24 07:13:31

F407步進電機梯形加減速算法是如何實現的？

使用梯形/S形加減速算法。加減速算法的實現中，我沒有采用之前的定時器主從模式的方式。因為沒有想到如何消除在定時器中斷服務程序中切換PWM波輸出頻率時產生的短暫延時。看來很多文章，還是試著用翻轉電平的方法來產生PWM波。原理/思路...

2021-07-08 09:52:37

Github開源的數字手勢識別CNN模型簡析

2.概述一個簡單的AI開發sampleGithub開源的數字手勢識別CNN模型，識別數字0-10十一種手勢類LeNet-5，兩個卷積層，兩個池化層，一個全連接層，一個Softmax輸出層3.RKNN

2022-04-02 15:22:11

STM32：F407步進電機S形加減速算法的實現相關資料分享

項目中對步進電機運行速度有了新要求，所以嘗試實現梯形加減速算法，S形加減速算法。本文主要實現S形加減速算法。原理/思路步進電機有啟動頻率這一概念。在啟動時有一個最大啟動頻率，在低于最大啟動頻率的速度

2021-06-28 10:07:24

S型曲線加減速算法

一年前做過的S型曲線加減速算法，再次做的時候竟然犯錯，在此總結記錄一下，方便以后查閱，同時希望幫助初學者提供簡單的參考資料（注：本項目采用的帶細分的驅動器，MCU的OC比較輸出模塊產生50%的PWM

2021-08-31 08:55:42

S型曲線加減速算法

一年前做過的S型曲線加減速算法，再次做的時候竟然犯錯，在此總結記錄一下，方便以后查閱，同時希望幫助初學者提供簡單的參考資料（注：本項目采用的帶細分的驅動器，MCU的OC比較輸出模塊產生50%的PWM方波）。S型曲線的的方程，在[-5，5]的圖形如下圖所示：如要將此曲線應用在...

2021-09-03 06:52:10

TF之CNN：CNN實現mnist數據集預測

TF之CNN：CNN實現mnist數據集預測 96%采用placeholder用法+2層C及其max_pool法+隱藏層dropout法+輸出層softmax法+目標函數cross_entropy法+

2018-12-19 17:02:40

一文詳解CNN

1 CNN簡介 CNN即卷積神經網絡(Convolutional Neural Networks)，是一類包含卷積計算的神經網絡，是深度學習（deep learning）的代表算法之一，在圖像識別

2023-08-18 06:56:34

人臉檢測算法及新的快速算法

人臉檢測算法及新的快速算法人臉識別設備憑借著便捷的應用，以及更加新潮的技術，俘獲了不少人的好感。于是，它的應用也在日益的變得更加的廣泛。由中國電子學會主辦的全國圖形圖像技術應用大會，行業專家將介紹

2013-09-26 15:13:24

介紹加速度計和陀螺儀的數學模型和基本算法

本帖翻譯自IMU（加速度計和陀螺儀設備）在嵌入式應用中使用的指南。這篇文章主要介紹加速度計和陀螺儀的數學模型和基本算法，以及如何融合這兩者，側重算法、思想的討論

2021-08-06 08:04:17

介紹加速度計和陀螺儀的數學模型和基本算法

本帖翻譯自IMU（加速度計和陀螺儀設備）在嵌入式應用中使用的指南。這篇文章主要介紹加速度計和陀螺儀的數學模型和基本算法，以及如何融合這兩者，側重算法、思想的討論介紹本指南旨在向興趣者介紹慣性MEMS（微機電系統）傳感器，特別是加速度計和陀螺儀以及其他整合IMU（慣性測量

2021-08-09 06:46:21

關于S型曲線加減速算法的知識點不看肯定后悔

關于S型曲線加減速算法的知識點不看肯定后悔

2021-10-28 08:52:37

分享一種超級實用的步進電機調速算法

[導讀] 大家好，我是逸珺。今天想分享一種超級實用的步進電機調速算法，這種算法在步進電機調速方案中可以說是一種非常優異的方案。梯形調速算法為啥需要設計一個調速算法呢？步進電機不是給多少脈沖就動多少步

2021-09-03 09:05:44

加減速算法主要分為哪幾種？

加減速算法是運動控制中的關鍵技術之一，也是實現高速、高效率的關鍵因素之一。在工業控制中，一方面要求加工的過程平滑、穩定，柔性沖擊小；另一方面需要響應時間快，反應迅速。在保證控制精度的前提下來提高加工

2021-07-07 07:37:15

壓縮模型會加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡單的 CNN 導入到 STM32L462RCT我發現壓縮模型對推理時間沒有影響。aiRun 程序在 8

2023-01-29 06:24:08

啟動停止頻繁步進電機加減速算法目的是什么

電機加減速算法目的：對于上述2、3的場合，步進電機容易出現丟步和過沖甚至無法啟動的現象，所以加入該算法來解決這一問題。3. 算法實現3.1加減速期望曲線...

2021-07-07 07:58:50

基于 FPGA 的目標檢測網絡加速電路設計

CNN 更容易滿足實際應用場景中的低功耗、實時性要求。而且目標檢測算法發展迅速，針對 CNN 的硬件加速研究也大有可為。所以本項目計劃使用 PYNQ-Z2 開發板設計一個硬件電路來加速目標檢測算法

2023-06-20 19:45:12

基于LabVIEW的語音信號變速算法設計與實現

基于LabVIEW的語音信號變速算法設計與實現要做這樣一個題目求大神指教最好有現成的可以加我q聯系 690316376

2016-04-19 09:49:50

基于YOLOX目標檢測算法的改進

基礎的 AlexNet 算法框架，極大的提升了算法的速度和準確度。相比于傳統目標檢測算法，以CNN 為核心的目標檢測算法具有準確率高、檢測速度快等優點，發展潛力巨大。根據神經網絡的結構不同，可以將目標檢測算法

2023-03-06 13:55:27

基于數字CNN與生物視覺的仿生眼設計

建立視覺信號的并行、快速處理的數學模型和快速算法，實現圖像信號和視神經纖維上動作電位的轉換，是對信息科學中信號處理提出的一個新的挑戰[2]。第一代視覺仿生眼的預期功能是讓患者能進行慢速的閱讀，識別一些

2009-09-19 09:35:15

大家是怎么壓榨CNN模型的

【技術綜述】為了壓榨CNN模型，這幾年大家都干了什么

2019-05-29 14:49:27

如何去實現一種4x4整數變換的快速算法？

本文提出一種基于TM1300的4x4整數變換的快速算法，使用了并行算是技術大大減少了計算量。

2021-06-04 06:41:35

如何將DS_CNN_S.pb轉換為ds_cnn_s.tflite？

MIMRTX1064(SDK2.13.0)的KWS demo中放置了ds_cnn_s.tflite文件，提供demo中使用的模型示例。在 read.me 中，聲明我可以找到腳本，但是，該文檔中的腳本

2023-04-19 06:11:51

怎么實現STM32步進電機S型加減速算法？

怎么實現STM32步進電機S型加減速算法？

2021-10-11 07:57:55

怎么實現S形加減速算法？

怎么實現S形加減速算法？

2021-10-09 09:16:34

怎么實現步進電機S型曲線加減速算法？

怎么實現步進電機S型曲線加減速算法？

2021-10-12 10:02:51

梯形加減速算法實現

梯形加減速速度曲線采用“梯形”加減速算法，在運動過程中分成以下四個狀態：空閑狀態，加速狀態，勻速狀態與減速狀態。圖1 梯形加減速速度曲線加減速算法實現...

2022-01-11 08:25:05

步進電機S加減速算法與查表方式哪個更好？

步進電機S加減速算法與查表方式哪個更好，有誰用過，能否提供實例？

2023-11-08 08:10:26

步進電機S型曲線加減速算法與實現

年前做過的S型曲線加減速算法，再次做的時候竟然犯錯，在此總結記錄一下，方便以后查閱，同時希望幫助初學者提供簡單的參考資料（注：本項目采用的帶細分的驅動器，MCU的OC比較輸出模塊產生50%的PWM

2018-03-20 16:46:13

步進電機為啥需要設計一個調速算法？

步進電機為啥需要設計一個調速算法？

2021-10-29 07:29:16

步進電機加減速算法相關資料分享

步進電機加減速算法

2022-01-11 06:45:22

步進電機梯形加減速算法的原理是什么

目錄步進電機梯形加減速梯形加減速算法原理分析算法實現步進電機梯形加減速電機的控制方式一般分為開環控制與閉環控制兩種控制方式，其中開環控制原理框圖如下：這種種控制方式的特點是：控制簡單、實現容易、價格

2021-07-07 07:53:48

步進電機梯形勻加速算法是什么

最近公司的一個項目用帶驅動器的步進電機，奈何，經理讓我搞個勻加速的啟動和停止。以前從來沒考慮過算法的我，走了很多彎路，不過最后還是解決了這個問題。梯形加減速應該是指數加速算法和S型加速算法中最簡單也

2021-07-08 06:49:48

步進電機的S型曲線加減速算法與實現

2021-06-28 08:41:08

步進電機驅動算法——S形加減速算法原理精選資料下載

目錄步進電機S形加減速簡介七段S形加減速算法原理分析五段S形加減速算法實現算法分析查表法編程實現思路及方法S曲線加減速流程圖步進電機S形加減速簡介一個物體從起點運動到終點要經歷加速、勻速、減速的過程

2021-07-08 09:18:53

求一種基于嵌入式實時內核ARTXl66的電子差速算法

本文介紹一種基于嵌入式實時內核ARTXl66的電子差速算法

2021-05-13 06:46:56

虛擬實驗室構建思路

我想做虛擬實驗室，比如像物理實驗、化學實驗，目前沒有太多的思路，有經驗的朋友指導下，目前正在看電路算法。

2017-07-28 11:04:27

請問怎樣去設計一種MPEG-4 加速器？

如何去選擇并優化IDCT快速算法？怎樣去設計一種MPEG-4加速器？如何對MPEG-4加速器進行仿真驗證？

2021-06-04 07:20:42

量化算法介紹及其特點分析

推理。通過這篇文章你可以學習到以下內容：1）量化算法介紹及其特點分析，讓你知其然并知其所以然； 2）Pytorch 量化實戰，讓你不再紙上談兵；3）模型精度及性能的調優經驗分享，讓你面對問題不再束手無策...

2021-07-26 08:08:31

陀螺儀漂移測試原理及其實驗技術

陀螺儀漂移測試原理及其實驗技術

2016-08-17 12:09:47

離散傅里葉變換及其快速算法

離散傅里葉變換及其快速算法離散傅里葉變換 (Discrete Fourier Transform，DFT)是時間函數是離散的，而且頻譜函數也是離散的變換。3. 1 討論周期序列的傅里葉級數及其性質。

2008-10-30 12:54:54

三維表面粗糙度高斯濾波快速算法

三維表面粗糙度高斯濾波快速算法:研究了三維表面粗糙度評定基準的數學模型及采用高斯濾波器得到三維表面評定基準的數字算法,提出一種新的用于三維表面的快速高斯濾波卷積

2009-09-25 15:47:49

序列圖像運動目標檢測的一種快速算法

序列圖像運動目標檢測的一種快速算法:研究了序列視頻圖像中運動目標的檢測與跟蹤快速算法．研究基于Kalman濾波理論的漸消記憶最小二乘法，用該方法重建背景圖像；采用圖像差

2009-10-26 11:23:23

一種求解電大平臺天線互耦的時域積分方程快速算法

一種求解電大平臺天線互耦的時域積分方程快速算法:該文針對電大尺寸平臺天線互耦問題，提出一種基于幾何繞射理論加速的時域積分方程快速算法。在求解時域積分方程的經典時

2009-10-29 13:01:52

基于H.264 的子帶DCT快速算法

DCT 快速算法是H.264 編碼的關鍵問題之一。該文根據H.264 中4×4 塊殘差系數的分布特征及DCT 系數的能量分布特性，提出一種基于DCT 系數子帶劃分的子帶DCT 快速算法。該算法在DCT 和量

2009-11-24 14:47:57

一種K分布雜波參數估計的快速算法

該文對K 分布雜波模型統計特性做了深入分析和推導，提出了一種新的運用樣本算數平均和幾何平均的高精度低運算量的K 分布雜波模型參數估計快速算法，并對算法的估計精度作了

2009-11-25 14:48:10

C51實現單片機CRC快速算法

摘要：本文介紹了CRC的基本原理和計算方法，給出了利用C51實現單片機CRC的快速算法關鍵字：CRC；C51；單片機；快速算法

2010-09-10 11:14:57

雷達成像近似二維模型及其超分辨算法

雷達成像近似二維模型及其超分辨算法現有的雷達成像超分辨算法是基于目標回波信號的二維正弦信號模型，所以模型誤差，特別是距離走動誤差，將使算法性能嚴重

2009-10-21 15:45:36

1888

匹配傅里葉變換快速算法及在雷達信號處理中應用

為了減小匹配傅里葉變換分析的計算量，提出了一種基于快速傅里葉變換的快速算法。根據匹配傅里葉變換的分解將積分形式轉化為離散形式，推導出快速算法表達式。該算法與直接的

2013-07-26 11:48:36

簡單實用的單片機CRC快速算法

本文提供兩個實用的、能夠在單片機上通過軟件來實現CRC快速算法。

2016-03-22 16:40:31

三相多電平逆變器SVPWM的一種統一快速算法

三相多電平逆變器SVPWM的一種統一快速算法

2016-03-30 14:59:59

一種新型柔性加減速算法

一種新型柔性加減速算法，有需要的下來看看

2016-04-29 17:57:09

微段加工柔性加減速算法研究

微段加工柔性加減速算法研究，有需要的下來看看

2016-04-29 17:57:09

變加減速算法在位置伺服系統中的應用與分析

變加減速算法在位置伺服系統中的應用與分析

2016-05-04 14:37:01

S曲線加減速算法研究

S曲線加減速算法研究，又需要的朋友下來看看

2016-05-04 14:37:01

離散傅里葉變換(DFT)及其快速算法(FFT)

第2章-離散傅里葉變換(DFT)及其快速算法(FFT)

2016-12-28 14:23:30

一種改進的增維型雙邊濾波的快速算法

一種改進的增維型雙邊濾波的快速算法_李俊峰

2017-01-07 16:00:43

基于FPGA的ECC快速算法研究及設計

基于FPGA的ECC快速算法研究及設計_陳俊杰

2017-01-07 19:08:43

低頻往復式微動磨損測試系統驅動頻率影響及其實驗研究_王仲楠

低頻往復式微動磨損測試系統驅動頻率影響及其實驗研究_王仲楠

2017-01-08 13:26:49

基于光流的運動目標檢測跟蹤快速算法_關興來

基于光流的運動目標檢測跟蹤快速算法_關興來

2017-03-16 15:42:48

一種基于ImpulseC的素域橢圓曲線點乘快速算法_崔強強

一種基于ImpulseC的素域橢圓曲線點乘快速算法_崔強強

2017-03-19 11:46:35

基于查表的無乘法DCT快速算法 Jpeg壓縮算法中的DCT快速算法

基于查表的無乘法DCT快速算法 Jpeg壓縮算法中的DCT快速算法

2017-09-18 09:47:55

基于圖像增強的去霧快速算法的介紹及其在FPGA中的實現

基于圖像增強方法，本文提出了一種使用亮度映射的圖像去霧快速算法。此算法通過調整室外多霧場景圖像的對比度，提高了霧中物體的辨識度。算法的復雜度低、處理延遲小，實時性高，利于FPGA的實現。實現時不需外存儲器，延時為ns級，并提供了強度調節接口，以適應較廣的應用環境。

2017-10-11 18:39:38

DM6446的車牌定位快速算法實現與優化

DM6446的車牌定位快速算法實現與優化

2017-10-26 15:27:05

基于FPGA的通用CNN加速設計

基于FPGA的通用CNN加速器整體框架如下，通過Caffe/Tensorflow/Mxnet等框架訓練出來的CNN模型，通過編譯器的一系列優化生成模型對應的指令;同時，圖片數據和模型權重數據按照優化規則進行預處理以及壓縮后通過PCIe下發到FPGA加速器中

2017-10-27 14:09:58

9882

商湯聯合提出基于FPGA的Winograd算法：改善FPGA上的CNN性能降低算法復雜度

商湯科技算法平臺團隊和北京大學高能效實驗室聯合提出一種基于 FPGA 的快速Winograd算法，可以大幅降低算法復雜度，改善 FPGA 上的 CNN 性能。

2018-02-07 11:52:06

8687

Kortiq小巧高效的CNN加速器，支持所有類型

Kortiq提供易于使用，可擴展且小巧的CNN加速器。該設備支持所有類型的CNN，并動態加速網絡中的不同層類型。

2018-11-23 06:28:00

2957

如何結合改進主動學習的SVD-CNN進行彈幕文本分類算法資料說明

為解決傳統卷積神經網絡（CNN）模型使用池化層進行文本特征降維會損失較多文本語義信息的問題，提出一種基于奇異值分解（SVD）算法的卷積神經網絡模型（SVD-CNN）。首先，采用改進的基于密度中心點

2019-05-06 11:42:47

深度學習模型壓縮與加速綜述

成為了學術界和工業界都重點關注的研究領域之一。本文主要介紹深度學習模型壓縮和加速算法的三個方向，分別為加速網絡結構設計、模型裁剪與稀疏化、量化加速。

2019-06-08 17:26:00

4836

基于MBNS滑動窗口的多標量乘快速算法

MENS）和交錯MBNS滑動窗口（I-MBNS的多標量乘快速算法，分析并比較兩種多標量乘快速算法在二元域和素域及不同窗口寬度下的平均運算量。實驗結果表明，與 Shamir和交錯非鄰接形式算法相比， Sliding MBNS和I-MBNS算法在標量長度為160bit的二元域上的平均運算量分別減少了1

2021-03-11 11:17:42