在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

適用于MobileNets的易于量化可分離卷積架構

Tensorflowers ? 來源:未知 ? 作者:胡薇 ? 2018-10-09 08:55 ? 次閱讀

IEEE LPIRC 挑戰賽

低功耗圖像識別挑戰賽 (LPIRC)是一年一度的競賽,主要從準確度、執行時間和能量消耗方面評估計算機視覺技術。今年的競賽由 Google 和 Facebook 贊助,共分為三個賽道,其中賽道 1 的挑戰目標是使用由Qualcomm Snapdragon 835 移動平臺支持的 Pixel 2 智能手機,在 10 分鐘的時間限制內處理 20000 張圖像,同時最大程度地保證圖像分類的準確度。此次競賽使用大型數據集作為訓練數據,其中包含大約 120 萬張 JPEG 圖像,涵蓋 1000 個不同類別,同時使用 Holdout 圖像集作為測試數據。

現實世界需要能夠在移動設備上實時運行且可準確進行圖像分類的神經網絡模型,此項公開競賽正是為此目的而舉行。除準確度以外,計算效率對電池供電設備也至關重要。在競賽中,我們團隊將易于量化的 MobileNet V2 架構與先進的量化后方案結合使用,并因絕佳速度和準確度拔得頭籌。我們使用每層計算好的最小和最大值插入 FakeQuantization 節點,以修改 TensorFlow 中的圖表,并使用 TensorFlow Lite 將圖表轉化為用于硬件部署的.tflite 文件。

Qualcomm Canada Inc 的團隊成員:Parker Zhang、Liang Shen、Chen Feng、Terry Sheng、Jay Zhuo 和 Zhiyu Liang

我們的模型在單個 ARM CPU 上的每次推理中以 28 毫秒識別 20000 張圖像時,實現了最高的準確度。

Qualcomm Technologies, Inc. 工程部副總裁 Mickey Aleksic 說:“此次挑戰與我們的 AI 戰略完美契合,而贏得這次競賽對于確立 Qualcomm Technologies 在機器學習中的重要地位以及推廣設備中的 AI 大有幫助?!?/p>

實現設備上的極速圖像識別

在邊緣設備上準確快速地識別圖像需要執行以下步驟:

創建和訓練一個神經網絡模型,從而以浮點運算對圖像進行識別和分類。

將浮點模型轉化為定點模型,后者可以在邊緣設備上高效運行,而不會出現延遲和準確度問題。

我們團隊的模型基于MobileNet v2構建,但以 “易于量化” 的方式進行了修改。雖然 Google 的 MobileNet 模型通過使用可分離卷積結構成功縮小了參數大小和計算延時,但直接量化預訓練的 MobileNet v2 模型可能會造成準確度下降。我們的團隊分析并找出了在此類可分離卷積網絡中因量化而降低準確度的根本原因,并在不使用量化感知重新訓練的情況下解決了此問題。通過量化感知訓練,模型可獲得良好的準確度,而我們的方法是一種替代方案,能夠修改網絡架構以解決量化問題,而無需重新訓練。另一種更為端到端的方法是使用 Google 的 ML 框架Learn2Compress,通過優化多個網絡架構和同時使用量化及其他技術(如提煉、剪枝和聯合訓練),直接從頭開始訓練高效的設備上模型或現有的 TensorFlow 模型。

模型架構

在可分離卷積結構中,我們將深度卷積分別應用于每個通道。但是,用于權重量化的最小和最大值是從所有通道中整體獲取的。由于數據范圍的擴大,某個通道中的異常值可能會導致整個模型的量化損失。如果未在不同通道中進行數據計算,深度卷積結構可能會在某個通道內產生全零值的權重,而這在 MobileNet v1 和 v2 模型中都很常見。某個通道中的全零值意味著偏差很小。在完成深度卷積后,直接應用批量歸一化轉換時,預計該特定通道的"縮放"值會較大。這會損害整個模型的表示能力。

我們的團隊提出一種易于量化的高效可分離卷積架構作為解決方案,將深度和逐點卷積層之間的非線性操作(批量歸一化和 ReLU6)全部移除,讓網絡學習合適的權重來直接處理批量歸一化轉換。此外,我們還將所有逐點卷積層中的 ReLU6 替換為 ReLU。在使用 MobileNet v1 和 v2 模型進行的多項試驗中,此架構在 8 位量化通道中展示出顯著的準確度提升。

量化后技術

定義模型結構后,您便可在數據集上訓練浮點模型。在量化后步驟中,我們使用各種不同的輸入內容并針對訓練數據中各個類別的單張圖像運行模型,以收集最小和最大值以及每層輸出的數據直方圖分布。我們選取最佳 “步長” 和 “偏移” 值(用 ? 表示)以用于線性量化,這可以在貪婪搜索期間最大限度地減小量化損失和飽和損失的總量。根據計算出的最小和最大值范圍,TensorFlow Lite 提供了將圖表模型轉化為.tflite 模型的路徑,以便在邊緣設備上部署模型。

Qualcomm Technologies, Inc 的 Ning Bi(上圖右側中間)代表團隊領獎

結論

將計算移至 8 位并保留較高的準確度是在邊緣設備上快速高效地運行模型的關鍵步驟。我們的團隊發現了此量化問題,分析并找出其根本原因,然后解決了此問題。之后,我們將這些發現應用于圖像分類挑戰賽,并看到我們的理論成果變為了現實。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像識別
    +關注

    關注

    9

    文章

    524

    瀏覽量

    38456
  • Qualcomm
    +關注

    關注

    8

    文章

    676

    瀏覽量

    52358

原文標題:實現設備上的節能圖像識別 — Qualcomm Technologies 的方法

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    適用于TCA9511A的EVM用戶指南

    電子發燒友網站提供《適用于TCA9511A的EVM用戶指南.pdf》資料免費下載
    發表于 12-23 15:32 ?0次下載
    <b class='flag-5'>適用于</b>TCA9511A的EVM用戶指南

    適用于PoE應用的低成本隔離式電源

    電子發燒友網站提供《適用于PoE應用的低成本隔離式電源.pdf》資料免費下載
    發表于 12-21 09:39 ?0次下載
    <b class='flag-5'>適用于</b>PoE應用的低成本隔離式電源

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    可分離卷積(Depthwise separable convolution)由逐深度卷積和逐點卷積組成,深度卷積
    發表于 12-19 14:33

    NVIDIA推出適用于網絡安全的NIM Blueprint

    德勤使用適用于容器安全的 NVIDIA NIM Agent Blueprint 幫助企業利用開源軟件構建安全的 AI。
    的頭像 發表于 11-20 09:58 ?331次閱讀

    適用于MySQL的dbForge架構比較

    dbForge Schema Compare for MySQL 是一種工具,用于輕松有效地比較和部署 MySQL 數據庫結構和腳本文件夾差異。該工具提供了 MySQL 數據庫架構中所有差異的全面視圖。
    的頭像 發表于 10-28 09:41 ?288次閱讀
    <b class='flag-5'>適用于</b>MySQL的dbForge<b class='flag-5'>架構</b>比較

    適用于TMS320C5504/05的電源

    電子發燒友網站提供《適用于TMS320C5504/05的電源.pdf》資料免費下載
    發表于 10-11 11:18 ?0次下載
    <b class='flag-5'>適用于</b>TMS320C5504/05的電源

    7MFL5430-2AA10雷達波料位計適用于哪些物料

    雷達波料位計適用于多種物料的測量,包括液體、漿料、顆粒料和固體塊狀物料等。同時,它還適用于各種惡劣環境和變化環境,廣泛應用于多個行業領域。
    的頭像 發表于 10-08 16:11 ?268次閱讀

    適用于工業應用的使用MDIO的以太網PHY配置

    電子發燒友網站提供《適用于工業應用的使用MDIO的以太網PHY配置.pdf》資料免費下載
    發表于 09-21 10:24 ?0次下載
    <b class='flag-5'>適用于</b>工業應用的使用MDIO的以太網PHY配置

    選擇適用于汽車應用的基準電壓

    電子發燒友網站提供《選擇適用于汽車應用的基準電壓.pdf》資料免費下載
    發表于 09-02 11:26 ?0次下載
    選擇<b class='flag-5'>適用于</b>汽車應用的基準電壓

    適用于AR眼鏡的TI DLP? Pico?技術

    電子發燒友網站提供《適用于AR眼鏡的TI DLP? Pico?技術.pdf》資料免費下載
    發表于 08-23 09:21 ?0次下載
    <b class='flag-5'>適用于</b>AR眼鏡的TI DLP? Pico?技術

    LMP91051是否適用于Pyreos的雙通道?

    LMP91051是否適用于Pyreos的雙通道(兩顆sensor集成在同一封裝中,共用電源和地)熱釋電紅外傳感器
    發表于 08-19 07:17

    4芯M9插座具備可分離性嗎

    德索工程師說道4芯M9插座通常設計為可插拔的,這意味著它們天生就具備可分離性。設計時會考慮到易于連接和斷開,以便于現場安裝、維護或更換。在不同的應用場景中,可分離性的需求也不盡相同。例如,在一些需要頻繁更換或連接的設備中,如測試
    的頭像 發表于 04-18 14:35 ?421次閱讀
    4芯M9插座具備<b class='flag-5'>可分離</b>性嗎

    微軟正式發布適用于Windows的Sudo

    微軟已在 Windows 11 Insider Preview Build 26052 中發布適用于 Windows 的 Sudo,并將其在 MIT 協議下進行開源。
    的頭像 發表于 03-19 09:20 ?954次閱讀
    微軟正式發布<b class='flag-5'>適用于</b>Windows的Sudo

    是否有適用于CYBT-343026-01的SPICE型號?

    您是否有適用于 CYBT-343026-01 的 SPICE 型號? 該模塊將在本質安全應用中使用,并且需要知道內部電容/電感。
    發表于 03-01 07:56

    MediaTek推出一種適用于低功耗物聯網設備的T300 5G RedCap平臺

    MediaTek 在 2024 世界移動通信大會(MWC 2024)上發布 5G RedCap (5G 輕量化)產品組合的新成員 — MediaTek T300 平臺,適用于廣泛的低功耗物聯網設備。
    的頭像 發表于 02-26 16:42 ?709次閱讀
    主站蜘蛛池模板: 天天做天天爱夜夜爽 | 2017天天干夜夜操 | 日本在线视频二区 | 国产亚洲美女精品久久久久狼 | 九九re6精品视频在线观看 | 狠狠色噜噜综合社区 | 天天碰天天 | 超级乱淫片67194免费看 | 老司机午夜网站 | 视频在线观看免费网址 | 欧美三级在线视频 | 欧美在线bdsm调教一区 | 免费看欧美一级特黄a大片 免费看欧美一级特黄a大片一 | 国产欧美亚洲精品第二区首页 | 亚洲免费成人在线 | semm亚洲欧美在线高清 | 成人亚洲视频 | 在线播放 你懂的 | 男女性生动态免费视频 | 欧美成人aaaa免费高清 | freesexvideo性欧美tv | 额去鲁97在线观看视频 | 老色皮 | videofreeones性欧美另类 | 国产真实乱xxxav | 99视频网址 | 国产成人精品免费视频大全可播放的 | 天天操夜夜摸 | 欧美午夜精品久久久久久黑人 | 亚洲一区二区三区四区五区六区 | 日本在线不卡免 | 色多多·com| www.87福利| jzzjlzz亚洲乱熟在线播放 | 一级一级毛片免费播放 | 亚洲乱码卡一卡二卡三永久 | 天天狠狠 | 婷婷色六月 | 亚洲天天综合网 | 手机看片免费永久在线观看 | 国产精品九九热 |