在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI的模型壓縮技術(shù)

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Rakesh R. Nakod ? 2022-10-19 14:22 ? 次閱讀

深度學(xué)習(xí)在模型及其數(shù)據(jù)集方面正在以驚人的速度增長(zhǎng)。在應(yīng)用方面,深度學(xué)習(xí)市場(chǎng)以圖像識(shí)別為主,其次是光學(xué)字符識(shí)別,以及面部和物體識(shí)別。根據(jù) Allied 的市場(chǎng)調(diào)查,2020 年全球深度學(xué)習(xí)市場(chǎng)規(guī)模為 68.5 億美元,預(yù)計(jì)到 2030 年將達(dá)到 1799.6 億美元,從 2021 年到 2030 年的復(fù)合年增長(zhǎng)率為 39.2%。

在某個(gè)時(shí)間點(diǎn),人們認(rèn)為大型和復(fù)雜的模型表現(xiàn)更好,但現(xiàn)在它幾乎是一個(gè)神話。隨著邊緣AI的發(fā)展,越來越多的技術(shù)將大型復(fù)雜模型轉(zhuǎn)換為可以在邊緣上運(yùn)行的簡(jiǎn)單模型,所有這些技術(shù)結(jié)合在一起執(zhí)行模型壓縮。

什么是模型壓縮?

模型壓縮是在具有低計(jì)算能力和內(nèi)存的邊緣設(shè)備上部署SOTA(最先進(jìn)的)深度學(xué)習(xí)模型的過程,而不會(huì)影響模型在準(zhǔn)確性,精度,召回性等方面的性能。模型壓縮廣泛地減少了模型中的兩件事,即大小和延遲。大小減小側(cè)重于通過減少模型參數(shù)使模型更簡(jiǎn)單,從而減少執(zhí)行中的 RAM 要求和內(nèi)存中的存儲(chǔ)要求。減少延遲是指減少模型進(jìn)行預(yù)測(cè)或推斷結(jié)果所花費(fèi)的時(shí)間。模型大小和延遲通常是一起的,大多數(shù)技術(shù)都會(huì)減少兩者。

流行的模型壓縮技術(shù)

修剪:

修剪是模型壓縮的最流行的技術(shù),它通過刪除冗余和無關(guān)緊要的參數(shù)來工作。神經(jīng)網(wǎng)絡(luò)中的這些參數(shù)可以是連接器、神經(jīng)元、通道,甚至是層。它很受歡迎,因?yàn)樗瑫r(shí)減小了模型的大小并改善了延遲。

pYYBAGNPl6-AZ2uZAAGw_oTIvEs500.png

修剪

修剪可以在訓(xùn)練模型時(shí)或在訓(xùn)練后完成。有不同類型的修剪技術(shù),包括重量/連接修剪,神經(jīng)元修剪,過濾器修剪和層修剪。

量化:

當(dāng)我們?cè)谛藜糁幸瞥窠?jīng)元,連接,過濾器,層等以減少加權(quán)參數(shù)的數(shù)量時(shí),權(quán)重的大小在量化過程中減小。在此過程中,較大集中的值將映射到較小集中的值。與輸入網(wǎng)絡(luò)相比,輸出網(wǎng)絡(luò)的值范圍較窄,但保留了大部分信息。

知識(shí)提煉:

在知識(shí)提煉過程中,一個(gè)復(fù)雜而大型的模型在一個(gè)非常大的數(shù)據(jù)集上被訓(xùn)練。微調(diào)大型模型后,它可以很好地處理看不見的數(shù)據(jù)。一旦實(shí)現(xiàn),這些知識(shí)就會(huì)轉(zhuǎn)移到較小的神經(jīng)網(wǎng)絡(luò)或模型中。同時(shí)使用教師網(wǎng)絡(luò)(較大模型)和學(xué)生網(wǎng)絡(luò)(較小模型)。這里存在兩個(gè)方面,知識(shí)提煉,其中我們不調(diào)整教師模型,而在遷移學(xué)習(xí)中,我們使用確切的模型和權(quán)重,在一定程度上改變模型,并針對(duì)相關(guān)任務(wù)進(jìn)行調(diào)整。

poYBAGNPl7aAcED2AAB8DjxHRCw852.png

知識(shí)蒸餾系統(tǒng)

知識(shí)、蒸餾算法和師生架構(gòu)模型是典型知識(shí)蒸餾系統(tǒng)的三個(gè)主要部分,如上圖所示。

低矩陣分解:

矩陣構(gòu)成了大多數(shù)深度神經(jīng)架構(gòu)的大部分。該技術(shù)旨在通過應(yīng)用矩陣或張量分解并將它們變成更小的矩陣來識(shí)別冗余參數(shù)。當(dāng)應(yīng)用于密集 DNN(深度神經(jīng)網(wǎng)絡(luò))時(shí),此技術(shù)可降低 CNN(卷積神經(jīng)網(wǎng)絡(luò))層的存儲(chǔ)要求和因式分解,并縮短推理時(shí)間。具有二維且具有秩 r 的權(quán)重矩陣 A 可以分解為更小的矩陣,如下所示。

poYBAGNPl72AUTPYAABK48-5WA8433.png

低矩陣因式分解

模型準(zhǔn)確性和性能在很大程度上取決于正確的因式分解和秩選擇。低秩因式分解過程中的主要挑戰(zhàn)是更難實(shí)現(xiàn),并且計(jì)算密集型。總體而言,與全秩矩陣表示相比,密集層矩陣的因式分解可導(dǎo)致更小的模型和更快的性能。

由于邊緣AI,模型壓縮策略變得非常重要。這些方法相互補(bǔ)充,可以在整個(gè)AI管道的各個(gè)階段使用。像張量流和Pytorch這樣的流行框架現(xiàn)在包括修剪和量化等技術(shù)。最終,該領(lǐng)域使用的技術(shù)數(shù)量將會(huì)增加。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 連接器
    +關(guān)注

    關(guān)注

    99

    文章

    15182

    瀏覽量

    139117
  • RAM
    RAM
    +關(guān)注

    關(guān)注

    8

    文章

    1391

    瀏覽量

    116647
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5554

    瀏覽量

    122416
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    邊緣AI MPU深度盤點(diǎn):品牌、型號(hào)與技術(shù)特性全解析

    邊緣AI MPU深度盤點(diǎn):品牌、型號(hào)與技術(shù)特性全解析 隨著邊緣計(jì)算與人工智能的深度融合,邊緣AI
    的頭像 發(fā)表于 04-30 17:27 ?1869次閱讀

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場(chǎng)景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    意法半導(dǎo)體邊緣AI套件中提供的全部工具

    意法半導(dǎo)體邊緣AI套件(ST Edge AI Suite)是一套專為邊緣AI開發(fā)設(shè)計(jì)的集成化工具集合,覆蓋從數(shù)據(jù)采集、
    的頭像 發(fā)表于 04-21 17:46 ?342次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    ,聯(lián)發(fā)科帶來了全面升級(jí)的天璣AI開發(fā)套件2.0,在模型庫(kù)規(guī)模、架構(gòu)開放程度、前沿端側(cè)AI技術(shù)支持和端側(cè)LoRA訓(xùn)練落地等方面均迎來全面躍遷,為開發(fā)者提供了更全面、更開放、更強(qiáng)大的端側(cè)
    發(fā)表于 04-13 19:52

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么處理?

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦,試了好幾個(gè)模型壓縮了也不行,ram占用過大,有無解決方案?
    發(fā)表于 03-11 07:18

    AI模型托管原理

    AI模型托管的核心在于將訓(xùn)練好的AI模型部署在云端或邊緣服務(wù)器上,由第三方平臺(tái)提供模型運(yùn)行、管理
    的頭像 發(fā)表于 02-26 10:31 ?308次閱讀

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    在數(shù)字化轉(zhuǎn)型的浪潮中,AI邊緣計(jì)算的結(jié)合正掀起一場(chǎng)深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關(guān)作為連接物理世界與數(shù)字世界的橋梁,在AI技術(shù)的加持下,正從簡(jiǎn)單的
    發(fā)表于 02-15 11:41

    研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

    隨著深度求索(DeepSeek)大模型的發(fā)布引發(fā)行業(yè)熱議,研華科技基于昇騰Atlas平臺(tái)邊緣AI Box MIC-ATL3S正式發(fā)布與Deepseek R1模型的部署流程。該平臺(tái)依托昇
    的頭像 發(fā)表于 02-14 16:08 ?951次閱讀
    研華<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b> Box MIC-ATL3S部署Deepseek R1<b class='flag-5'>模型</b>

    DeepSeek模型成功部署,物通博聯(lián)在 AI 賦能工業(yè)上持續(xù)探索、不斷前行

    和二次開發(fā),DeepSeek R1模型的發(fā)布迅速點(diǎn)燃了AI產(chǎn)業(yè)的革命之火。 DeepSeek R1 通過蒸餾將大模型的推理能力“壓縮”至小模型
    的頭像 發(fā)表于 02-12 11:15 ?433次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    并非易事,它涉及到從選擇合適的算法架構(gòu)到針對(duì)特定硬件平臺(tái)進(jìn)行優(yōu)化等一系列復(fù)雜的工作。 接下來,我們將詳細(xì)介紹如何在資源受限的邊緣設(shè)備上成功部署目標(biāo)檢測(cè)模型,探索其背后的原理和技術(shù),并討論解決該領(lǐng)域內(nèi)常見
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設(shè)備的奇妙之旅:如何在邊緣端部署OpenCV

    識(shí)別、分類、跟蹤、場(chǎng)景重建等。這可能涉及到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型的應(yīng)用。 簡(jiǎn)而言之,圖像處理是計(jì)算機(jī)視覺的基礎(chǔ),提供了必要的工具和技術(shù)來預(yù)處理和優(yōu)化圖像數(shù)據(jù);而計(jì)算機(jī)視覺則是在此基礎(chǔ)之上,通過更加復(fù)雜
    發(fā)表于 12-14 09:31

    AI模型部署邊緣設(shè)備的奇妙之旅:如何實(shí)現(xiàn)手寫數(shù)字識(shí)別

    系統(tǒng)的智能化水平,還極大地拓展了其應(yīng)用范圍, 使得嵌入式系統(tǒng)在智能家居、智能交通、智能醫(yī)療等領(lǐng)域有了更深層次的運(yùn)用。AI技術(shù)的嵌入,已經(jīng)成為未來嵌入式系統(tǒng)發(fā)展 的一個(gè)重要趨勢(shì)。踏入邊緣端部署的第一步
    發(fā)表于 12-06 17:20

    AI模型托管原理分析

    AI模型托管是指將訓(xùn)練好的AI模型部署在云端或邊緣服務(wù)器上,由第三方平臺(tái)提供模型運(yùn)行、管理和優(yōu)化
    的頭像 發(fā)表于 11-07 09:33 ?505次閱讀

    云天勵(lì)飛邊緣AI推動(dòng)大模型規(guī)模化應(yīng)用落地

    2024年毫無疑問是大模型應(yīng)用落地元年,面對(duì)靈活多變的任務(wù)和復(fù)雜的場(chǎng)景環(huán)境,用邊緣AI打造低成本、高效能、強(qiáng)落地的大模型應(yīng)用是關(guān)鍵。
    的頭像 發(fā)表于 09-18 14:59 ?609次閱讀

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計(jì)算盒子詳解

    的解決方案。AI邊緣盒子的主要用途在于利用邊緣計(jì)算和人工智能技術(shù),在數(shù)據(jù)產(chǎn)生源頭附近即時(shí)處理數(shù)據(jù),提供低延遲和高響應(yīng)性能。例如,在智慧工地上,AI
    的頭像 發(fā)表于 05-29 14:24 ?1400次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計(jì)算盒子詳解
    主站蜘蛛池模板: 1024手机最新手机在线 | 午夜视频色 | 国产精品17p | 偷偷久久 | 日本毛片在线观看 | 精品欧美一区二区三区 | 天天干夜夜玩 | 爱啪网站 | 日韩a免费 | 四虎在线永久 | 成年视频在线观看 | 爱爱的免费视频 | 四虎伊人| 又黑又长黑人欧美三级 | 日韩三级免费 | 天堂最新版在线www在线 | 欧美日韩无| 色婷婷六月桃花综合影院 | tube69日本老师 | 8090yy理论三级在线观看 | 国产特黄一级毛片特黄 | 久久黄网站 | 日韩免费高清一级毛片 | 好大好紧好爽好湿润视频 | www色午夜 | 久久久精品免费视频 | 色视频在线 | 国产精品久久久亚洲第一牛牛 | 韩日成人| 国产精品美女久久久久网 | 97人人看 | 免费看黄色录像 | 欧美一级片网址 | 欧美 变态 另类 人妖班 | 欧美一级视频在线高清观看 | 美国一级大黄香蕉片 | 女人扒开腿让男人桶到爽 | 国产亚洲视频在线播放大全 | 亚洲一区二区三区精品视频 | 在线视频免费视频网站 | 午夜亚洲国产精品福利 |