91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

構建一個移動端友好的SAM方案MobileSAM

CVer ? 來源:CVer ? 2023-06-30 10:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

本文提出一種"解耦蒸餾"方案對SAM的ViT-H解碼器進行蒸餾,同時所得輕量級編碼器可與SAM的解碼器"無縫兼容"。在推理速度方面,MobileSAM處理一張圖像僅需10ms,比FastSAM的處理速度快4倍。

SAM(Segment Anything Model)是一種提示詞引導感興趣目標分割的視覺基礎模型。自提出之日起,SAM引爆了CV社區,也衍生出了大量相關的應用(如檢測萬物、摳取萬物等等),但是受限于計算量問題,這些應用難以用在移動端。

本文旨在將SAM的"重量級"解碼器替換為"輕量級"以使其可在移動端部署應用。為達成該目標,本文提出一種"解耦蒸餾"方案對SAM的ViT-H解碼器進行蒸餾,同時所得輕量級編碼器可與SAM的解碼器"無縫兼容" 。此外,所提方案,只需一個GPU不到一天時間即可完成訓練,比SAM小60倍且性能相當,所得模型稱之為MobileSAM。在推理速度方面,MobileSAM處理一張圖像僅需10ms(8ms@Encoder,2ms@Decoder),比FastSAM的處理速度快4倍,這就使得MobileSAM非常適合于移動應用。

SAM

b65f4d78-1696-11ee-962d-dac502259ad0.png

上圖給出了SAM架構示意圖,它包含一個"重量級"ViT編碼器與一個提示詞引導Mask解碼器。解碼器以圖像作為輸入,輸出將被送入Mask解碼器的隱特征(embedding);Mask解碼器將基于提示詞(如point、bbox)生成用于目標分割的Mask。此外,SAM可以對同一個提示詞生成多個Mask以緩解"模棱兩可"問題。更多關于SAM及衍生技術可參考文末推薦閱讀材料。

b68e9164-1696-11ee-962d-dac502259ad0.png

延續SAM架構體系:采用輕量級ViT解碼器生成隱特征,然后采用提示詞引導解碼器生成期望的Mask。本文目標:構建一個移動端友好的SAM方案MobileSAM,即比原生SAM更快且具有令人滿意的性能。考慮到SAM不同模塊之間的參數量問題,本文主要聚焦于采用更輕量型的Encoder替換SAM的重量級Encoder。

實現方案

b699ec08-1696-11ee-962d-dac502259ad0.png

Coupled Distillation 一種最直接的方式是參考SAM方案重新訓練一個具有更小Encoder的SAM,見Figure2左圖。如SAM一文所提到:SAM-ViT-H的訓練需要256個A100,且訓練時間達68小時;哪怕Encoder為ViT-B也需要128個GPU。這樣多的資源消耗無疑阻礙了研究人員進行復現或改進。此外,需要注意的是SAM所提供數據集的Mask是有預訓練SAM所生成,本質上講,重訓練過程也是一種知識蒸餾過程,即講ViT-H學習到的知識遷移到輕量級Encoder中。

Semi-coupled Distillation 當對原生SAM進行知識蒸餾時,主要困難在于: Encoder與Decoder的耦合優化,兩者存在互依賴。有鑒于此,作者將整個知識蒸餾過程拆解為Encoder蒸餾+Decoder微調,該方案稱之為半耦合蒸餾(Semi-coupled Distillation),見Figure2右圖。也就是說,我們首先對Encoder進行知識蒸餾,然后再與Decoder進行協同微調。

b6a4df28-1696-11ee-962d-dac502259ad0.png

Decoupled Distillation 根據經驗,我們發現這種半耦合蒸餾方案仍然極具挑戰性,這是因為提示詞的選擇具有隨機性,使得Decoder可變,進而導致優化變難。有鑒于此,作者提出直接對原生SAM的編碼器進行蒸餾且無需與Decoder組合,該方案稱之為解耦合蒸餾。該方案的一個優勢在于:僅需使用MSE損失即可,而無需用于Mask預測的Focal與Dice組合損失。

Necessity of Mask Decoder Finetuning 不同于半耦合蒸餾,經解耦合蒸餾訓練得到的輕量級Encoder可能與凍結的Decoder存在不對齊問題。根據經驗,我們發現:該現象并不存在。這是因為學生Encoder生成的隱特征非常接近于原始老師Encoder生成的隱特征,因此并不需要與Decoder進行組合微調。當然,進一步的組合微調可能有助于進一步提升性能。

b6d1c1aa-1696-11ee-962d-dac502259ad0.png

Preliminary Evaluation 上表對比了耦合蒸餾與解耦合蒸餾的初步對比。可以看到:

從指標方面,解耦合蒸餾方案指標稍高,0.75mIoU vs 0.72mIoU;

從訓練GPU方面,解耦合蒸餾方案僅需兩個GPU,遠小于耦合蒸餾方案的128卡,大幅降低了對GPU的依賴;

從迭代次數方面,解耦合蒸餾方案僅需55k次迭代,遠小于耦合蒸餾方案的180K,大幅降低了訓練消耗;

從訓練數據方面,解耦合蒸餾方案僅需11K數據量,遠小于耦合蒸餾方案的11M,大幅降低了數據依賴。

盡管如此,但ViT-B對于移動端部署仍然非常困難。因此,后續實驗主要基于TinyViT進行。

本文實驗

b6ddecd2-1696-11ee-962d-dac502259ad0.png

在具體實現方面,作者基于ViT-Tiny進行本文所提方案的有效性驗證,所得MobileSAM與原生SAM的參數+速度的對比可參考上表。在訓練方面,僅需SA-1B的1%數據量+單卡(RTX3090),合計訓練8個epoch,僅需不到一天即可完成訓練。

b6e865a4-1696-11ee-962d-dac502259ad0.pngb71b3f92-1696-11ee-962d-dac502259ad0.png

上述兩個圖給出了point與bbox提示詞下MobileSAM與原生SAM的結果對比,可以看到:MobileSAM可以取得令人滿意的Mask預測結果。

消融實驗

b736499a-1696-11ee-962d-dac502259ad0.png

上表從訓練超參bs、epoch、iter等維度進行了對比分析,可以看到:

在同等迭代次數下,提升bs可以進一步提升模型性能;

在同等bs下,提升iter可以進一步提升模型性能。

b73edc68-1696-11ee-962d-dac502259ad0.png

上報對比了FastSAM與MobileSAM,可以看到:

從參數量方面,MobileSAM只有不到10M的參數量,遠小于FastSAM的68M;

從處理速度方面,MobileSAM僅需10ms,比FastSAM的40ms快4倍.

b751bcf2-1696-11ee-962d-dac502259ad0.png

上圖從Segment everything角度對比了SAM、FastSAM以及MobileSAM三個模型,可以看到:

MobileSAM與原生SAM結果對齊驚人的好,而FastSAM會生成一些無法滿意的結果;

FastSAM通常生成非平滑的邊緣,而SAM與MobileSAM并沒有該問題。

最后,補充一下Segment Anything與Segment Everything之間的區別。

如SAM一文所提到,SAM通過提示詞進行物體分割,也就是說,提示詞的作用是指定想分割哪些物體。理論上講,當給定合適的提示詞后,任何目標都可以被分割,故稱之為Segment Anything。

相反,Segment Everything本質上是物體候選框生成過程,不需要提示詞。故它往往被用來驗證下游任務上的zero-shot遷移能力。

總而言之,Segment Anything解決了任意物體的提示分割基礎任務;Segment Everything則解決了所有物體面向下游任務的候選框生成問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3822

    瀏覽量

    138380
  • 模型
    +關注

    關注

    1

    文章

    3531

    瀏覽量

    50564
  • SAM
    SAM
    +關注

    關注

    0

    文章

    115

    瀏覽量

    33975

原文標題:Faster Segment Anything

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【愛芯派 Pro 開發板試用體驗】+ 圖像分割和填充的Demo測試

    /ChaoningZhang/MobileSAM)是輕量化的框架,它的目標是通過用輕量化圖像編碼器取代復雜的圖像編碼器,使SAM移動
    發表于 12-26 11:22

    移動適配方案

    移動適配方案
    發表于 05-17 17:08

    種在金上生成硫醇封SAM的新方法

    種在金上生成硫醇封SAM的新方法 - 應用簡報
    發表于 10-30 11:05

    基于SAM3S4C器件被動紅外參考設計

    SAM3S運動探測器相機的被動紅外參考設計(PIRRD)。該電路為硬件和軟件工程師提供了詳細的指導和說明,構建了建筑或家庭報警和監控系統中的低成本,功能強大的無源紅外移動探測器攝像頭。參考設計基于
    發表于 05-19 09:14

    SMART SAM4C微控制器有哪些應用?

    愛特梅爾(Atmel)公司的SMART SAM4C微控制器是系統級芯片解決方案,用于智能電源應用,它是基于兩高性能的32位ARM Cortex-M4 RISC處理器構建。這些器件運行
    發表于 11-23 12:19

    法國DREAM方案SAM5504B/SAM5704B音源芯片

    `法國dream芯片系列供應,提供整套開發工具(下載器評估板開發板)SAM5704B /SAM5704BSAM2634B /SAM5504 法國DREAMDSP音頻芯片 應用范圍:電
    發表于 06-22 15:40

    關于Atmel SAM4L方案設計的介紹講解

    Atmel - SAM4L方案設計
    的頭像 發表于 07-10 01:15 ?2533次閱讀

    關于SAM4L方案設計的介紹

    Atmel - SAM4L方案設計簡介
    的頭像 發表于 07-09 00:48 ?2421次閱讀

    如何快速構建移動跨平臺視頻通話應用

    今天我們就來看下如何使用 Agora Flutter SDK 快速構建簡單的移動跨平臺視頻通話應用。
    的頭像 發表于 02-24 06:01 ?3185次閱讀
    如何快速<b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>移動</b>跨平臺視頻通話應用

    中興聯手廣州移動實現構建的5G地鐵切片

    5月28日,中興通訊與廣州移動在廣州塔地鐵站率先實現了全球首個5G SA環境的無線PRB(Physical Recourse Block,物理資源塊)硬隔離切片方案,解決方案涵蓋了5G商用終端、5G基站、承載及5G核心網,
    的頭像 發表于 06-03 15:47 ?3528次閱讀

    如何構建完整的物聯網解決方案

    冷鏈物流的復雜性、成本和風險使其成為物聯網的理想使用案例。以下是我們如何構建完整的物聯網解決方案,以應對這些挑戰。
    發表于 06-24 17:46 ?4918次閱讀

    利用GT-SAM的緊耦合激光雷達慣導里程計的框架

    LIO-SAM 提出了利用GT-SAM的緊耦合激光雷達慣導里程計的框架。實現了高精度、實時的移動機器人的軌跡估計和建圖。
    的頭像 發表于 10-31 09:25 ?3051次閱讀

    構建移動RFID閱讀器

    電子發燒友網站提供《構建移動RFID閱讀器.zip》資料免費下載
    發表于 12-05 10:31 ?1次下載
    <b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>移動</b>RFID閱讀器

    構建移動應用程序

    電子發燒友網站提供《構建移動應用程序.zip》資料免費下載
    發表于 07-04 14:33 ?0次下載
    <b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>移動</b>應用程序

    如何構建演示移動應用

    作為通訊工具,視頻會議幾乎隨處可見,尤其適用于遠程辦公和社交互動。但其使用體驗并非總是簡單直接、即開即用,可能需要進行調整,確保音頻視頻設置良好。其中,照明便是難以把握的因素。在會議中,光線充足
    的頭像 發表于 11-15 11:43 ?576次閱讀
    如何<b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b>演示<b class='flag-5'>移動</b><b class='flag-5'>端</b>應用
    主站蜘蛛池模板: 看黄a大片 免费 | 国产小视频在线 | 欧美一级做一a做片性视频 欧美一级做一级做片性十三 | 天天操夜夜嗨 | 天天干天天要 | 特黄特色大片免费视频播放 | 五月婷综合 | 真实女人寂寞偷人视频 | 久久香蕉国产线看观看亚洲片 | 欧美黄色高清 | 免费黄视频在线观看 | 奇米激情| 欧日韩美香蕉在线观看 | 色综合中文网 | 日本不卡一区在线 | 天天摸夜夜操 | 97影院午夜午夜伦不卡 | 丁香五婷婷 | 国产片一级特黄aa的大片 | 三级aa久久| 亚洲播播| 色综合网天天综合色中文男男 | 免费抓胸吻胸激烈视频网站 | 国产成人免费无庶挡视频 | 国产性夜夜性夜夜爽91 | 国产一级特黄a大片免费 | 人人人人草| 日本一区二区三区在线网 | 国产精品主播在线 | 日本一区二区高清免费不卡 | 精品色视频| 好紧好湿好黄的视频 | 美女黄18以下禁止观看的网站 | 欧美性天天 | 欧美黑人5o厘米全进去 | 在线观看亚洲免费视频 | 国产www色 | 人人入人人爱 | 悠悠影院欧美日韩国产 | 一级做a爰片久久毛片图片 一级做a爰片久久毛片鸭王 | 亭亭色|