91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

STMCube.AI的高級特性

意法半導體中國 ? 來源:意法半導體中國 ? 作者:意法半導體中國 ? 2021-10-28 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

STM32Cube.AI意法半導體AI生態系統的一部分,是STM32Cube的一個擴展包,它可以自動轉換和優化預先訓練的神經網絡模型并將生成的優化庫集成到用戶項目中,從而擴展了STM32CubeMX的功能。它還提供幾種在桌面PC和STM32上驗證神經網絡模型以及測量模型性能的方法,而無需用戶手工編寫專門的C語言代碼。

上一篇文章大致介紹了STMCube.AI的基本特性,以及其工作流程。

本文將更深入地介紹它的一些高級特性。將涉及以下主題:

運行時環境支持:Cube.AI vs TensorFlow Lite

量化支持

圖形流與存儲布局優化

可重定位的二進制模型支持

運行時環境支持:Cube.AI vs TensorFlow Lite

STM32Cube.AI支持兩種針對不同應用需求的運行時環境:Cube.AI和TensorFlow Lite。作為默認的運行時環境,Cube.AI是專為STM32高度優化的機器學習庫。而TensorFlow Lite for Microcontroller是由谷歌設計,用于在各種微控制器或其他只有幾KB存儲空間的設備上運行機器學習模型的。其被廣泛應用于基于MCU的應用場景。STM32Cube.AI集成了一個特定的流程,可以生成一個即時可用的STM32 IDE項目,該項目內嵌TensorFlow Lite for Microcontrollers運行時環境(TFLm)以及相關的TFLite模型。這可以被看作是Cube.AI運行時環境的一個替代方案,讓那些希望擁有一個跨多個項目的通用框架的開發人員也有了選擇。

雖然這兩種運行時環境都是為資源有限的MCU而設計,但Cube.AI在此基礎上針對STM32的獨特架構進行了進一步優化。因此,TensorFlow Lite更適合有跨平臺可移植性需求的應用,而Cube.AI則更適合對計算速度和內存消耗有更高要求的應用。

下表展示了兩個運行時環境之間的性能比較(基于一個預訓練的神經網絡參考模型)。評價指標是在STM32上的推斷時間和內存消耗。

f0560440-378b-11ec-82a8-dac502259ad0.png

如表中所示,對于同一模型,Cube.AI運行時環境比TFLite運行時環境節約了大概20%的flash存儲和約8%的RAM存儲。此外,它的運行速度幾乎比TFLite運行時環境快了2倍。

對于TFLite模型,用戶可以在STM32Cube.AI的網絡配置菜單中對2個運行時環境進行選擇。

量化支持

量化是一種被廣泛使用的優化技術,它將32位浮點模型壓縮為位數更少的整數模型,在精度只略微下降的情況下,減少了存儲大小和運行時的內存峰值占用,也減少了CPU/MCU的推斷時間和功耗。量化模型對整數張量而不是浮點張量執行部分或全部操作。它是面向拓撲、特征映射縮減、剪枝、權重壓縮等各種優化技術的重要組成部分,可應用在像MCU一樣資源受限的運行時環境。

通常有兩種典型的量化方法:訓練后量化(PTQ)和量化訓練(QAT)。PTQ相對容易實現,它可以用有限的具有代表性的數據集來量化預先訓練好的模型。而QAT是在訓練過程中完成的,通常具有更高的準確度。

STM32Cube.AI通過兩種不同的方式直接或間接地支持這兩種量化方法:

首先,它可以用來部署一個由PTQ或QAT過程生成的TensorFlow Lite量化模型。在這種情況下,量化是由TensorFlow Lite框架完成的,主要是通過“TFLite converter” utility導出TensorFlow Lite文件。

其次,其命令行接口(CLI)還集成了一個內部的訓練后量化(PTQ)的過程,支持使用不同的量化方案對預訓練好的Keras模型進行量化。與使用TFLite Converter工具相比,該內部量化過程提供了更多的量化方案,并在執行時間和精確度方面有更好的表現。

下表顯示了在STM32上部署量化模型(與原有浮點模型相比)的好處。此表使用FD-MobileNet作為基準模型,共有12層,參數大小145k,MACC操作數24M,輸入尺寸為224x224x3。

f2376d1c-378b-11ec-82a8-dac502259ad0.png

從表中很容易看出,量化模型節省了約4倍的flash存儲和RAM存儲,且運行速度提高了約3倍,而精確度僅僅下降了0.7%。

如果已經安裝了X-Cube-AI包,用戶可以通過以下路徑找到關于如何使用命令行界面(CLI)進行量化的教程

C:UsersusernameSTM32CubeRepositoryPacksSTMicroelectronicsX-CUBE-AI7.0.0Documentationquantization.html。

在文檔的末尾還附上了一個快速實踐示例:“量化一個MNIST模型”。

圖形流與存儲布局優化

除了量化技術,STM32Cube.AI還通過使用其C代碼生成器的優化引擎,針對推理時間優化內存使用(RAM & ROM)。該引擎基于無數據集的方法,無需驗證或測試數據集來應用壓縮和優化算法

第一種方法:權重/偏置項壓縮,采用k -均值聚類算法。該壓縮算法僅適用于全連接層。其優勢是壓縮速度快,但是結果并不是無損的,最終的精度可能會受到影響。STM32Cube.AI提供“驗證”功能,用于對所生成的C模型中產生的誤差進行評估。

“壓縮”選項可以在STM32Cube.AI的網絡配置中激活,如下圖所示:

第二種方法:操作融合,通過合并層來優化數據布局和相關的計算核。轉換或優化過程中會刪除一些層(如“Dropout”、“Reshape”),而有些層(如非線性層以及卷積層之后的池化層)會被融合到前一層中。其好處是轉換后的網絡通常比原始網絡層數少,降低了存儲器中的數據吞吐需求。

最后一種方法是優化的激活項存儲。其在內存中定義一個讀寫塊來存儲臨時的隱藏層值(激活函數的輸出)。此讀寫塊可以被視為推理函數使用的暫存緩沖區,在不同層之間被重復使用。因此,激活緩沖區的大小由幾個連續層的最大存儲需求決定。比如,假設有一個3層的神經網絡,每一層的激活值分別有5KB, 12KB和3KB,那么優化后的激活緩沖區大小將是12KB,而不是20KB。

可重定位的二進制模型支持

非可重定位方法(或“靜態”方法)指的是:生成的神經網絡C文件被編譯并與最終用戶應用程序堆棧靜態鏈接在一起。

如下圖所示,所有對象(包括神經網絡部分和用戶應用程序)根據不同的數據類型被一起鏈接到不同的部分。在這種情況下,當用戶想要對功能進行部分更新時(比如只更新神經網絡部分),將需要對整個固件進行更新。

相反,可重定位二進制模型指定一個二進制對象,該對象可以安裝和執行在STM32內存子系統的任何位置。它是所生成的神經網絡C文件的編譯后的版本,包括前向核函數以及權重。其主要目的是提供一種靈活的方法來更新AI相關的應用程序,而無需重新生成和刷寫整個終端用戶固件。

生成的二進制對象是一個輕量級插件。它可以從任何地址(位置無關的代碼)運行,其數據也可放置于內存中的任何地方(位置無關的數據)。

STM32Cube.AI簡單而高效的AI可重定位運行時環境可以將其實例化并使用它。STM32固件中沒有內嵌復雜的資源消耗型動態鏈接器,其生成的對象是一個獨立的實體,運行時不需要任何外部變量或函數。

下圖的左側部分是神經網絡的可重定位二進制對象,它是一個自給自足的獨立實體,鏈接時將被放置于終端用戶應用程序的一個單獨區域中(右側部分)。它可以通過STM32Cube.AI的可重定位運行時環境被實例化以及動態鏈接。因此,用戶在更新AI模型時只需要更新這部分二進制文件。另外,如果有進一步的靈活性需求,神經網絡的權重也可以選擇性地被生成為獨立的目標文件。

可重定位網絡可以在STM32Cube.AI的高級設置中激活

最后,作為意法半導體人工智能生態系統的核心工具,STM32Cube.AI提供許多基本和高級功能,以幫助用戶輕松創建高度優化和靈活的人工智能應用。如需詳細了解特定解決方案或技術細節,請隨時關注我們的后續文章。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • mcu
    mcu
    +關注

    關注

    146

    文章

    17984

    瀏覽量

    367233
  • STM32
    +關注

    關注

    2293

    文章

    11032

    瀏覽量

    365164
  • AI
    AI
    +關注

    關注

    88

    文章

    35168

    瀏覽量

    280180
  • 模型
    +關注

    關注

    1

    文章

    3521

    瀏覽量

    50445

原文標題:AI技術專題之五:專為STM32 MCU優化的STM32Cube.AI庫

文章出處:【微信號:STMChina,微信公眾號:意法半導體中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    模態的技術特性,DeepSeek正加速推動AI在金融、政務、科研及網絡智能化等關鍵領域的深度應用。 信而泰:AI推理引擎賦能網絡智能診斷新范式信而泰深度整合DeepSeek-R1大模型系統,構建了新一代
    發表于 07-16 15:29

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、騰訊
    發表于 07-09 18:30

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現智能功能的特性,在一些網絡條件受限或對數據隱私有較高要求的場景中,發揮著不可或缺的作用。本章基于CSK6大模型語音
    發表于 07-04 11:14

    AI用芯片電感具備哪些電氣特性

    滿足AI服務器、智能機器人、智能控制無人機等行業對芯片電感的性能要求,科達嘉自主研發推出了AI用一體成型電感CSHN系列。產品采用科達嘉自主研發的金屬軟磁粉末熱壓成型,具有超低感量、極低直流電阻、高飽和等電氣特性,并采用輕薄型設
    的頭像 發表于 06-12 17:50 ?280次閱讀
    <b class='flag-5'>AI</b>用芯片電感具備哪些電氣<b class='flag-5'>特性</b>?

    邊緣AI MPU深度盤點:品牌、型號與技術特性全解析

    邊緣AI MPU深度盤點:品牌、型號與技術特性全解析 隨著邊緣計算與人工智能的深度融合,邊緣AI MPU(微處理器)已成為支撐物聯網、智能制造、自動駕駛等場景的核心硬件。本文從品牌、型號、技術
    的頭像 發表于 04-30 17:27 ?2277次閱讀

    AI 時代開啟,企業跟風做 AI 產品是明智之舉?

    AI
    華成工控
    發布于 :2025年04月10日 17:28:44

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    低功耗特性。搭載 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPS的 AI 計算能力,使其在計算機視覺、邊緣 AI 及智能制造等場景中大放異彩。 豐富接
    發表于 03-19 17:54

    AI智能體包含哪些組件

    AI 智能體是先進的 AI 系統,旨在根據高級目標自主進行推理,制定計劃并執行復雜任務。
    的頭像 發表于 03-04 13:45 ?907次閱讀
    <b class='flag-5'>AI</b>智能體包含哪些組件

    淵亭KGAG升級引入“高級策略推理”

    為了突破現有AI技術在決策推理方面的局限,淵亭科技對其知識圖譜分析平臺KGAG進行了最新升級,創新性地引入了“高級策略推理”模式。這一模式的引入,實現了“大模型×知識圖譜×專家策略×動態推理”的深度
    的頭像 發表于 02-14 15:07 ?539次閱讀

    數字電機控制的未來:一個MCU上的多個電機、嵌入式AI高級算法

    RA8T1 32位MCU采用Arm Cortex-M85內核,采用氦氣技術,頻率高達480MHz,封裝針對電機或逆變器控制進行了優化。與市場上的其他電機控制解決方案相比,該產品明顯更快、更先進,并為AI高級算法帶來了充足的動力,同時保持了對多個獨立電機的精確電子控制。
    發表于 11-20 14:33 ?1278次閱讀
    數字電機控制的未來:一個MCU上的多個電機、嵌入式<b class='flag-5'>AI</b>和<b class='flag-5'>高級</b>算法

    Wilink8高級特性

    電子發燒友網站提供《Wilink8高級特性.pdf》資料免費下載
    發表于 11-08 15:58 ?0次下載
    Wilink8<b class='flag-5'>高級</b><b class='flag-5'>特性</b>

    昆侖萬維天工AI發布升級版AI高級搜索功能

    昆侖萬維公司近期正式推出了天工AI的最新版本,其中重點升級了AI高級搜索功能。這一新功能旨在滿足用戶在復雜問題解決、金融投資、科研學術以及文檔分析等多個領域的多樣化需求。 據了解,天工AI
    的頭像 發表于 11-07 10:47 ?899次閱讀

    安達發|APS高級排程高級物料需求計劃

    APS高級排程高級物料需求計劃是在制造業中非常重要的概念。它們分別涉及到生產計劃和物料管理,對于提高生產效率、降低成本和滿足客戶需求具有重要意義。下面我將詳細介紹這兩個概念及其在實際生產
    的頭像 發表于 09-25 17:49 ?639次閱讀
    安達發|APS<b class='flag-5'>高級</b>排程<b class='flag-5'>高級</b>物料需求計劃

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理

    電子發燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI
    發表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b>加速器(DRP-<b class='flag-5'>AI</b>3):10x在<b class='flag-5'>高級</b><b class='flag-5'>AI</b>系統<b class='flag-5'>高級</b><b class='flag-5'>AI</b>中更快的嵌入處理

    云開發AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 14:41:54
    主站蜘蛛池模板: 狠狠丁香激情久久综合 | japanesexxx日本69| 在线中文字幕一区 | 日日干日日爽 | 男人的天堂在线精品视频 | 一区二区三区视频免费观看 | 亚洲综合成人在线 | 四虎最新永久免费网址 | 亚洲va久久久久综合 | 男女激情做爰叫床声视频偷拍 | 婷婷综合网站 | 黄色网免费 | 7777sq国产精品 | 婷婷久久综合九色综合98 | 午夜免费啪在线观看视频网站 | 欧美成人午夜 | 日本人69xxx| 亚洲另类激情综合偷自拍 | 国产一级特黄aa级特黄裸毛片 | 日韩特级毛片免费观看视频 | 亚洲激情 | 精品无码三级在线观看视频 | 亚洲一区欧美二区 | 亚洲欧洲精品成人久久曰影片 | 黄色天堂| 欧美不卡在线视频 | 在线成人免费观看国产精品 | avbobo在线观看 | 日韩城人视频 | 高清成人| 无毒不卡在线播放 | 日日操夜夜操免费视频 | 久久综合亚洲 | 日日艹| 久久九九国产精品怡红院 | 第三级视频在线观看 | 天天干天天曰天天操 | 中文天堂最新版在线精品 | 日本色婷婷 | 亚洲男人天堂岛 | 在线亚洲日产一区二区 |