在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于NXP微控制器i.MX RT1170的多人體實時檢測算法和系統

jf_pJlTbmA9 ? 來源: 恩智浦MCU加油站 ? 作者: 恩智浦MCU加油站 ? 2023-10-26 16:27 ? 次閱讀

恩智浦的i.MX RT系列跨界處理器,為在設備端實現智能運算提供了更高性價比的方案,解鎖了在嵌入式應用中部署人工智能算法的新途徑。

恩智浦的工程師們從多種角度,做了很多有創新的嘗試和工作,為客戶提供了豐富的選項,也很好地展示了i.MX RT產品的高性能和高擴展適應性。

本文及隨后的一些小文將分別介紹這些精彩的成果。

wKgZomU6Il6AP17gAARFeFEne4k452.png

引 言

多目標檢測機器學習重要的研究領域之一,可以廣泛應用于機器人,安防和工業監控等領域。

針對多目標檢測任務,目前比較流行的是基于卷積神經網絡(Conventional Neural Network,CNN)的算法,例如Yolo,SSD和RetinaNet等。

然而,目前已有CNN方法均不適用于嵌入式平臺的部署,這是因為目標檢測是一個比較繁重的任務,而現有的檢測模型過于復雜,對平臺的算力和內存的需求很高,因此無法將其部署在嵌入式平臺。

本文基于開源算法,提出了一種輕量化的目標檢測網絡,大量運用深度可分離卷積以及全新的尺度變換結構,使得模型計算復雜度和結構得到極大簡化,進而使多目標檢測在MCU上的實現成為可能。

提出的檢測算法在NXP微控制器i.MX RT1170上的部署實驗結果表明:該算法極大降低了對于ROMRAM的消耗,運行時間得到大幅度優化,檢測速度最高可達10FPS,并且模型精度可以媲美開源的YoloV3-tiny,YoloV4-tiny等模型。

實時多人體檢測算法

1. 網絡結構設計

本文采用的網絡結構設計主要分為兩部分,第一部分為網絡主體結構,用來逐層提取樣本的有效特征。該主體結構借鑒了MobileNetV2的輕量特性,并充分考慮了模型在部署方面對于ROM和RAM的優化。

網絡主要特點概括如下:

(1)大量運用深度可分離卷積來減少參數量,進而減少ROM的消耗。深度可分離卷積相對于傳統的卷積可以大大較少參數規模。例如對于一個輸入有8個通道,輸出有16個通道的傳統3*3卷積, 其參數量為16*8*3*3=1152;而深度可分離卷積參數量僅有8*3*3+1*1*8*16=200。

(2)模型結構設計上遵循的是加大網絡模型深度,縮小每層的寬度,這樣帶來的好處是減少每層推理所需要的內存占用。這是因為在嵌入式設備中,運行內存極為緊張,而優化過的模型可以減少RAM的使用。

(3)考慮到模型部署需要用到8位整型量化,這里我們采用Relu激活函數。這是因為目前還沒有任何研究表明哪種激活函數具有更高的精度,但對于量化來說,顯然Relu會比pRelu(圖1),leakyRelu或者sigmoid等函數具有更快的推理時間和更低的量化損失。

wKgaomUD8fiARRUWAACuAg5zw3M474.png 圖1 Relu和pRelu激活示意圖

(4)網絡設計中尺度變換結構采用了1*1,3*3和5*5三種卷積核尺寸,進而同時兼顧不同大小目標的定位精度;同時,我們提出的尺度預測結構更為簡單,減少了網絡模型部署的難度。

2. 網絡模型融合壓縮與量化

對于訓練后的網絡模型,可以通過網絡模型的融合壓縮以及量化技術,加快其在嵌入式設備上的推理時間。

因為本文設計網絡中為了使每層數據分布更加均勻(有助于減少整型量化中的損失),采用了Batchnorm對數據進行約束。此外,Batchnorm還可以將輸入分布更多的分散在非飽和區,進而減小梯度彌散,加快收斂過程。模型訓練結束后,Batchnorm中參數就固化了,可以將其參數融合進卷積層中,最終避免Batchnorm層在實際模型推理中的時間消耗。

模型量化的目的是為了加快模型在MCU上的推理時間,這是因為大多數MCU內核采用Arm Cortex-M 架構,其對定點乘法運算的速度要比浮點運算快得多。此外,模型量化還可以節省模型對于ROM和RAM的需求。

本文采用全8位整型量化的方式對模型進行推理加速。

3. 實驗結果分析

本文提出的模型針對目前較為流行的開源公版模型YoloV3-Tiny和YoloV4-Tiny進行對比,實驗結果如下:

wKgZomUD8fqAN6oxAAENuEdQmcU630.png
wKgaomUD8fyAJjfqAADSeZrvD2M740.png
wKgZomUD8f6ATkHWAADgzvHFLdk129.png 圖2 模型對比實驗圖

如圖2所示,該模型極大地降低了ROM和RAM的占用,這對于內存大小較為緊張的嵌入式設備來說意義重大。

而在推理時間上,本文提出的模型具有更為突出的優勢。作者在NXP微控制器i.MX RT1170(ARM Cortex-M7,1GHz)上的實驗結果表明,相比開源模型動輒幾秒鐘的推理時間,我們提出的網絡模型將時間消耗控制在200ms以內,使其部署在微控制器上更加高效。

注意,圖2中的時間消耗對比是假設YoloV3-Tiny和YoloV4-Tiny均進行8位整型量化,并且直接使用未經修改的開源算法得到的推理時間。實際上,直接使用開源的、未經修改的YoloV3-Tiny和YoloV4-Tiny等網絡結構,由于其復雜結構,部署難度較高。而本文提出網絡模型在結構上進行了極大優化,可以利用現有開源工具進行量化部署。

對于模型預測精度,作者進行了如圖3的測試對比實驗。在多個樣本集上,本文提出模型的預測精度可以媲美開源的YoloV3-Tiny和YoloV4-Tiny等模型。

wKgZomU6IpSARNKwAAkf-y7Fp0g733.png 圖3 模型預測效果對比圖

基于i.MX RT1170的實時多人體檢測系統

神經網絡模型在邊緣設備上的部署,是深度學習技術落地的一大關鍵部分。本文以多人體檢測模型為例,分享如何將現有的神經網絡模型,部署到NXP的微控制器i.MX RT1170EVK開發板上,并實現實時多人體檢測系統。

部署流程如圖4所示,首先需要將訓練的模型進行模型框架轉換,這是因為開源的量化工具僅支持少量的模型框架。

第二步需要對模型進行融合優化,然后利用量化工具將模型進行量化,并轉換為MCU可以執行的代碼;最后對模型的預處理和后處理進行編程實現,這樣攝像頭抓取的圖像數據就可以進行預處理后送入量化模型,然后根據模型輸出特征圖進行后處理,提取出有效的候選框作為預測框。

wKgZomUD8hOAcDPhAAEuC5nleH4175.png 圖4 神經網絡邊緣設備部署流程圖

本文采用NXP i.MX RT1170EVK開發板進行多人體檢測系統的實現。

i.MX RT1170是NXP的一款跨界MCU,采用主頻達1GHz的Cortex?-M7內核和主頻達400MHz的Cortex-M4,這里我們僅使用M7內核。

此外,RT1170EVK上搭載了MIPI接口的OV5640攝像頭,分辨率達到720*1280,同時配有5.5寸高清顯示屏,分辨率同樣達到720*1280。

這里我們采用FreeRTOS系統進行攝像頭的實時讀取和LCD的實時顯示,攝像頭和LCD的分辨率均設為最高的720*1280,刷新率均設為15FPS。

系統實現流程如圖5所示,攝像頭抓取的圖像經過PXP轉換,然后進行預處理送入模型,最后經過后處理將預測框顯示在LCD上。

wKgaomUD8haAV31YAAI2Qc2KH5Y381.png 圖5 人體檢測系統實現流程

最終,基于i.MX RT1170的人體檢測系統可以實現快速精準的多人體位置預測,測試視頻如下。

此外,本文算法的一大優勢在于運行時間可控,并不會因為被檢測人體數量的多少而改變。模型的速度決定了最遠檢測距離。以下測試結果分別是算法在10FPS,5FPS和3FPS速度下的最遠檢測距離。

wKgaomU6IsGAFFnnAAaFBvHJkr0883.png

圖6 算法檢測距離與速度

結束語

本文給出的多人體檢測算法和系統,為在NXP的MCU上部署多目標檢測任務帶來了更多的可能性。

結合深度學習模型網絡的優化,以及模型融合量化等技術,可以在保證模型精度的同時,實現在嵌入式平臺上推理速度的最優化,進而才能將深度學習技術更好的落地。

來源: 恩智浦MCU加油站
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯系小編進行處理

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微控制器
    +關注

    關注

    48

    文章

    7658

    瀏覽量

    152183
  • NXP
    NXP
    +關注

    關注

    60

    文章

    1290

    瀏覽量

    185580
  • ROM
    ROM
    +關注

    關注

    4

    文章

    575

    瀏覽量

    86027
  • RAM
    RAM
    +關注

    關注

    8

    文章

    1369

    瀏覽量

    115054
  • 算法
    +關注

    關注

    23

    文章

    4631

    瀏覽量

    93421
收藏 人收藏

    評論

    相關推薦

    基于i.MX RT1170的兩輪車數字儀表盤參考設計 全面的技術解讀

    采用i.MX RT1170跨界MCU構建的兩輪車儀表盤;全包式參考平臺:實現更快、更輕松的開發。恩智浦的互聯數字儀表盤參考平臺使車輛制造商能夠為兩輪車提供基本的儀表盤功能,同時還支持各種連接用例,提升騎行者體驗。
    的頭像 發表于 11-03 08:15 ?2061次閱讀
    基于<b class='flag-5'>i.MX</b> <b class='flag-5'>RT1170</b>的兩輪車數字儀表盤參考設計 全面的技術解讀

    i.MX RT1170的GPIO外設的使用

    在雙核的i.MX RT1170下設計應用程序,有一個比較重要的考慮點是片內外設資源共享以及任務分配問題,同樣一個任務既可以放在默認主核CM7下做,也可以放在默認從核 CM4下去完成。如果這個任務跟片內外設有關,那就得考慮該外設是否在兩個核下設計與使用一致,這在項目開始前必
    的頭像 發表于 09-01 08:46 ?2082次閱讀

    i.MX RT1170:VGLite移植RT-Thread Nano過程講解(下)

    上篇介紹了如何移植 RT-Thread Nano 內核與 Finsh 控制臺到 RT1170。本篇繼續介紹如何將 NXP 官方的 VGLite API 移植到
    的頭像 發表于 11-09 11:22 ?1006次閱讀

    i.MX RT1050平臺的相關資料推薦

    的首款跨界處理。該處理器具備應用處理的高性能與高度集成的優勢,更具有微控制器的易用性和實時功能。NXP Semiconductors(恩
    發表于 11-29 07:19

    i.MX RT1170車規級產品有AEC-Q100認證嗎?

    大家好如題,i.MX RT1170車規級產品有AEC-Q100認證嗎?如果是,能否提供相關文件?
    發表于 03-15 08:24

    是否可以將SPI接口顯示I.MX RT1170一起使用?

    是否可以將 SPI 接口顯示I.MX RT1170 一起使用。如果是,請附上可以使用的驅動軟件。我找到了 使用 SPI 接口的 NHD_4_3_800480FT_CSXP_CTP-3051926 顯示
    發表于 04-04 08:15

    i.MX RT1170自定義引導加載程序,如何在i.MX RT處理上完成?

    我將在我的自定義 i.MX RT1170 板上開發自定義引導加載程序。在我的例子中,閃存驅動程序將通過 USB 讀取以更新主要應用程序。 我正在研究
    發表于 05-17 08:13

    恩智浦i.MX RT1170開創GHz MCU時代

    自2017年上市以來,i.MX RT系列取得了優秀的市場表現。i.MX RT1170跨界MCU是恩智浦i.MX
    的頭像 發表于 03-22 11:14 ?3541次閱讀

    恩智浦i.MX RT1170在將該系列帶上了更高的層面

    自2017年上市以來,i.MX RT系列取得了優秀的市場表現。i.MX RT1170跨界MCU是恩智浦i.MX
    的頭像 發表于 05-18 11:15 ?3856次閱讀

    i.MX RT開發筆記-08 | i.MX RT1062嵌套中斷向量控制器NVIC(按鍵中斷檢測

    系列文章目錄i.MX RT開發筆記-01 | 初識 i.MX RT1062 跨界MCUi.MX RT
    發表于 12-01 13:51 ?2次下載
    <b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>開發筆記-08 | <b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1062嵌套中斷向量<b class='flag-5'>控制器</b>NVIC(按鍵中斷<b class='flag-5'>檢測</b>)

    來數數!這款i.MX RT1170智能廚房解決方案,用到了哪些NXP的黑科技?

    智能廚房解決方案 一款極具科技感的智能廚房解決方案 可以讓你通過觸摸屏和語音控制 與多種家電進行智能人機交互! 它是如何做到的? i.MX RT1170 1GHz雙核跨界MCU GUI Guider
    的頭像 發表于 02-04 12:40 ?903次閱讀

    I.MX RT1170配套PMIC PF5020使用方法

    I.MX RT1170將先進的電源管理模塊與DC-DC和LDO集成在一起,可降低外部電源的復雜性并簡化電源時序。
    的頭像 發表于 04-01 15:54 ?2485次閱讀

    i.MX RT1170評估套件快速入門:這份保姆級教程,請收藏!

    恩智浦官網精彩導覽 i.MX RT1170評估套件快速入門 i.MX RT1170 是恩智浦推出的首款主頻超過1GHz的跨界MCU,結合了強悍的計算能力、多種媒體功能、
    的頭像 發表于 05-12 11:55 ?2226次閱讀
    <b class='flag-5'>i.MX</b> <b class='flag-5'>RT1170</b>評估套件快速入門:這份保姆級教程,請收藏!

    i.MXRT1060和RT1170上使用高效神經網絡進行多人檢測

    電子發燒友網站提供《在i.MXRT1060和RT1170上使用高效神經網絡進行多人檢測.pdf》資料免費下載
    發表于 08-17 10:46 ?0次下載
    在<b class='flag-5'>i</b>.MXRT1060和<b class='flag-5'>RT1170</b>上使用高效神經網絡進行<b class='flag-5'>多人</b><b class='flag-5'>檢測</b>

    恩智浦i.MX RT1170 uSDHC eMMC啟動時間

    大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是恩智浦i.MX RT1170 uSDHC eMMC啟動時間。
    的頭像 發表于 08-08 15:32 ?696次閱讀
    恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT1170</b> uSDHC eMMC啟動時間
    主站蜘蛛池模板: 亚洲免费一区二区 | 国产小视频在线播放 | 久久精品国产99精品最新 | 午夜一级黄色片 | 一个色综合网站 | 色多多福利 | 亚洲国产人久久久成人精品网站 | 又粗又长又色又爽视频 | 夜夜嗷| 美女扒开内裤无遮挡禁18 | 黄色大片在线视频 | 亚洲区一二三四区2021 | 性欧美xxxx视频在线观看 | 久草资源在线播放 | 天天操天天操天天操香蕉 | 免费啪啪网站 | 天堂男人网| 午夜小视频网站 | 久久免费视频网站 | 在线免费亚洲 | 婷婷午夜 | 天天夜干 | 加勒比一区二区 | 色综合天天综合中文网 | 天天操天天干天天摸 | 能看的黄色网址 | 国产一级特黄 | 一级毛片真人免费播放视频 | 激情综合色五月丁香六月亚洲 | 久青草免费视频手机在线观看 | 天堂色| 天天干天天噜 | 久青草国产在线视频_久青草免 | 成人午夜免费剧场 | 午夜影院7cdy | 免费三级pq| 五月开心六月伊人色婷婷 | 美女视频很黄很a免费国产 美女视频很黄很暴黄是免费的 | 免费一级在线观看 | 色婷婷久久免费网站 | 五月六月伊人狠狠丁香网 |