IEEE LPIRC 挑戰賽
低功耗圖像識別挑戰賽 (LPIRC)是一年一度的競賽,主要從準確度、執行時間和能量消耗方面評估計算機視覺技術。今年的競賽由 Google 和 Facebook 贊助,共分為三個賽道,其中賽道 1 的挑戰目標是使用由Qualcomm Snapdragon 835 移動平臺支持的 Pixel 2 智能手機,在 10 分鐘的時間限制內處理 20000 張圖像,同時最大程度地保證圖像分類的準確度。此次競賽使用大型數據集作為訓練數據,其中包含大約 120 萬張 JPEG 圖像,涵蓋 1000 個不同類別,同時使用 Holdout 圖像集作為測試數據。
現實世界需要能夠在移動設備上實時運行且可準確進行圖像分類的神經網絡模型,此項公開競賽正是為此目的而舉行。除準確度以外,計算效率對電池供電設備也至關重要。在競賽中,我們團隊將易于量化的 MobileNet V2 架構與先進的量化后方案結合使用,并因絕佳速度和準確度拔得頭籌。我們使用每層計算好的最小和最大值插入 FakeQuantization 節點,以修改 TensorFlow 中的圖表,并使用 TensorFlow Lite 將圖表轉化為用于硬件部署的.tflite 文件。
Qualcomm Canada Inc 的團隊成員:Parker Zhang、Liang Shen、Chen Feng、Terry Sheng、Jay Zhuo 和 Zhiyu Liang
我們的模型在單個 ARM CPU 上的每次推理中以 28 毫秒識別 20000 張圖像時,實現了最高的準確度。
Qualcomm Technologies, Inc. 工程部副總裁 Mickey Aleksic 說:“此次挑戰與我們的 AI 戰略完美契合,而贏得這次競賽對于確立 Qualcomm Technologies 在機器學習中的重要地位以及推廣設備中的 AI 大有幫助?!?/p>
實現設備上的極速圖像識別
在邊緣設備上準確快速地識別圖像需要執行以下步驟:
創建和訓練一個神經網絡模型,從而以浮點運算對圖像進行識別和分類。
將浮點模型轉化為定點模型,后者可以在邊緣設備上高效運行,而不會出現延遲和準確度問題。
我們團隊的模型基于MobileNet v2構建,但以 “易于量化” 的方式進行了修改。雖然 Google 的 MobileNet 模型通過使用可分離卷積結構成功縮小了參數大小和計算延時,但直接量化預訓練的 MobileNet v2 模型可能會造成準確度下降。我們的團隊分析并找出了在此類可分離卷積網絡中因量化而降低準確度的根本原因,并在不使用量化感知重新訓練的情況下解決了此問題。通過量化感知訓練,模型可獲得良好的準確度,而我們的方法是一種替代方案,能夠修改網絡架構以解決量化問題,而無需重新訓練。另一種更為端到端的方法是使用 Google 的 ML 框架Learn2Compress,通過優化多個網絡架構和同時使用量化及其他技術(如提煉、剪枝和聯合訓練),直接從頭開始訓練高效的設備上模型或現有的 TensorFlow 模型。
模型架構
在可分離卷積結構中,我們將深度卷積分別應用于每個通道。但是,用于權重量化的最小和最大值是從所有通道中整體獲取的。由于數據范圍的擴大,某個通道中的異常值可能會導致整個模型的量化損失。如果未在不同通道中進行數據計算,深度卷積結構可能會在某個通道內產生全零值的權重,而這在 MobileNet v1 和 v2 模型中都很常見。某個通道中的全零值意味著偏差很小。在完成深度卷積后,直接應用批量歸一化轉換時,預計該特定通道的"縮放"值會較大。這會損害整個模型的表示能力。
我們的團隊提出一種易于量化的高效可分離卷積架構作為解決方案,將深度和逐點卷積層之間的非線性操作(批量歸一化和 ReLU6)全部移除,讓網絡學習合適的權重來直接處理批量歸一化轉換。此外,我們還將所有逐點卷積層中的 ReLU6 替換為 ReLU。在使用 MobileNet v1 和 v2 模型進行的多項試驗中,此架構在 8 位量化通道中展示出顯著的準確度提升。
量化后技術
定義模型結構后,您便可在數據集上訓練浮點模型。在量化后步驟中,我們使用各種不同的輸入內容并針對訓練數據中各個類別的單張圖像運行模型,以收集最小和最大值以及每層輸出的數據直方圖分布。我們選取最佳 “步長” 和 “偏移” 值(用 ? 表示)以用于線性量化,這可以在貪婪搜索期間最大限度地減小量化損失和飽和損失的總量。根據計算出的最小和最大值范圍,TensorFlow Lite 提供了將圖表模型轉化為.tflite 模型的路徑,以便在邊緣設備上部署模型。
Qualcomm Technologies, Inc 的 Ning Bi(上圖右側中間)代表團隊領獎
結論
將計算移至 8 位并保留較高的準確度是在邊緣設備上快速高效地運行模型的關鍵步驟。我們的團隊發現了此量化問題,分析并找出其根本原因,然后解決了此問題。之后,我們將這些發現應用于圖像分類挑戰賽,并看到我們的理論成果變為了現實。
-
圖像識別
+關注
關注
9文章
524瀏覽量
38456 -
Qualcomm
+關注
關注
8文章
676瀏覽量
52358
原文標題:實現設備上的節能圖像識別 — Qualcomm Technologies 的方法
文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
NVIDIA推出適用于網絡安全的NIM Blueprint
適用于MySQL的dbForge架構比較

7MFL5430-2AA10雷達波料位計適用于哪些物料
4芯M9插座具備可分離性嗎

微軟正式發布適用于Windows的Sudo

評論