在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ICCV 2023 | 超越SAM!EntitySeg:更少的數據,更高的分割質量

智能感知與物聯網技術研究所 ? 來源:未知 ? 2023-10-02 10:40 ? 次閱讀

稠密圖像分割問題一直在計算機視覺領域中備受關注。無論是在 Adobe 旗下的 Photoshop 等重要產品中,還是其他實際應用場景中,分割模型的泛化和精度都被賦予了極高的期望。對于這些分割模型來說,需要在不同的圖像領域、新的物體類別以及各種圖像分辨率和質量下都能夠保持魯棒性。為了解決這個問題,早在 SAM[6] 模型一年之前,一種不考慮類別的實體分割任務 [1] 被提出,作為評估模型泛化能力的一種統一標準。

在本文中,High-Quality Entity Segmentation 對分割問題進行了全新的探索,從以下三個方面取得了顯著的改進:

1. 更優的分割質量:正如上圖所示,EntitySeg 在數值指標和視覺表現方面都相對于 SAM 有更大的優勢。令人驚訝的是,這種優勢是基于僅占訓練數據量千分之一的數據訓練取得的。

2. 更少的高質量數據需求:相較于 SAM 使用的千萬級別的訓練數據集,EntitySeg 數據集僅含有 33,227 張圖像。盡管數據量相差千倍,但 EntitySeg 卻取得了可媲美的性能,這要歸功于其標注質量,為模型提供了更高質量的數據支持。

3. 更一致的輸出細粒度(基于實體標準):從輸出的分割圖中,我們可以清晰地看到 SAM 輸出了不同粒度的結果,包括細節、部分和整體(如瓶子的蓋子、商標、瓶身)。然而,由于 SAM 需要對不同部分的人工干預處理,這對于自動化輸出分割的應用而言并不理想。相比之下,EntitySeg 的輸出在粒度上更加一致,并且能夠輸出類別標簽,對于后續任務更加友好。

在闡述了這項工作對稠密分割技術的新突破后,接下來的內容中介紹 EntitySeg 數據集的特點以及提出的算法 CropFormer。

wKgaomUs_uaAD2aRAACSqit3Alw707.png

論文鏈接:https://arxiv.org/abs/2211.05776

代碼鏈接:

https://github.com/qqlu/Entity/blob/main/Entityv2/README.md

主頁鏈接:

http://luqi.info/entityv2.github.io/

根據 Marr 計算機視覺教科書中的理論,人類的識別系統是無類別的。即使對于一些不熟悉的實體,我們也能夠根據相似性進行識別。因此,不考慮類別的實體分割更貼近人類識別系統,不僅可以作為一種更基礎的任務,還可以輔助于帶有類別分割任務 [2]、開放詞匯分割任務 [3] 甚至圖像編輯任務 [4]。與全景分割任務相比,實體分割將“thing”和“stuff”這兩個大類進行了統一,更加符合人類最基本的識別方式。

wKgaomUs_uaAaVeYAAAl6LOgh3c146.png ?

EntitySeg數據集

由于缺乏現有的實體分割數據,作者在其工作 [1] 使用了現有的 COCO、ADE20K 以及 Cityscapes 全景分割數據集驗證了實體任務下模型的泛化能力。然而,這些數據本身是在有類別標簽的體系下標注的(先建立一個類別庫,在圖片中搜尋相關的類別進行定位標注),這種標注過程并不符合實體分割任務的初衷——圖像中每一個區域均是有效的,哪怕這些區域無法用言語來形容或者被 Blur 掉,都應該被定位標注。

此外,受限于提出年代的設備,COCO 等數據集的圖片域以及圖片分辨率也相對單一。因此基于現有數據集下訓練出的實體分割模型也并不能很好地體現實體分割任務所帶來的泛化能力。最后,原作者團隊在提出實體分割任務的概念后進一步貢獻了高質量細粒度實體分割數據集 EntitySeg 及其對應方法。EntitySeg 數據集是由 Adobe 公司 19 萬美元贊助標注完成,已經開源貢獻給學術界使用。

項目主頁:

http://luqi.info/entityv2.github.io/數據集有三個重要特性:1. 數據集匯集了來自公開數據集和學術網絡的 33,227 張圖片。這些圖片涵蓋了不同的領域,包括風景、室內外場景、卡通畫、簡筆畫、電腦游戲和遙感場景等。2. 標注過程在無類別限制下進行的掩膜標注,并且可以覆蓋整幅圖像。3. 圖片分辨率更高,標注更精細。如上圖所示,即使相比 COCO 和 ADE20K 數據集的原始低分辨率圖片及其標注,EntitySeg 的實體標注更全且更精細。最后,為了讓 EntitySeg 數據集更好地服務于學術界,11580 張圖片在標注實體掩膜之后,以開放標簽的形式共標注了 643 個類別。EntitySeg、COCO 以及 ADE20K 數據集的統計特性對比如下:wKgaomUs_uaADlXLAAEABS33bTg176.png通過和 COCO 以及 ADE20K 的數據對比,可以看出 EntitySeg 數據集圖片分辨率更高(平均圖片尺寸 2700)、實體數量更多(每張圖平均 18.1 個實體)、掩膜標注更為復雜(實體平均復雜度 0.719)。極限情況下,EntitySeg 的圖片尺寸可達到 10000 以上。與 SAM 數據集不同,EntitySeg 更加強調小而精,試圖做到對圖片中的每個實體得到最為精細的邊緣標注。此外,EntitySeg 保留了圖片和對應標注的原始尺寸,更有利于高分辨率分割模型的學術探索。基于 EntitySeg 數據集,作者衡量了現有分割模型在不同分割任務(無類別實體分割,語義分割,實例分割以及全景分割)的性能以及和 SAM 在 zero-shot 實體級別的分割能力。

wKgaomUs_uaARWVxAAEMAsNKrjY791.png

wKgaomUs_uaAU8AmAACkTHk6Ig4993.png

wKgaomUs_ueAGTK_AAAuhh9-KLM590.png ?

CropFormer算法框架

除此之外,高分辨率圖片和精細化掩膜給分割任務帶來了新的挑戰。為了節省硬件內存需求,分割模型需要壓縮高分辨率圖片及標注進行訓練和測試進而導致分割質量的降低。為了解決這一問題,作者提出了 CropFormer 框架來解決高分辨率圖片分割問題。CropFormer 受到 Video-Mask2Former [5] 的啟發, 利用一組 query 連結壓縮為低分辨率的全圖和保持高分辨率的裁剪圖的相同實體。因此,CropFormer 可以同時保證圖片全局和區域細節屬性。CropFormer 是根據 EntitySeg 高質量數據集的特點提出的針對高分辨率圖像的實例/實體分割任務的 baseline 方法,更加迎合當前時代圖片質量的需求。wKgaomUs_ueAKPi7AAH2IXUrEjs806.png

最后在補充材料中,作者展示了更多的 EntitySeg 數據集以及 CropFormer 的可視化結果。下圖為更多數據標注展示:

下圖為 CropFormer 模型測試結果:

參考文獻

[1] Open-World Entity Segmentation. TAPMI 2022.[2] CA-SSL: Class-agnostic Semi-Supervised Learning for Detection and Segmentation. ECCV 2022.[3] Open-Vocabulary Panoptic Segmentation with MaskCLIP. ICML 2023.[4] SceneComposer: Any-Level Semantic Image Synthesis. CVPR 2023.[5] Masked-attention Mask Transformer for Universal Image Segmentation. CVPR 2022.

[6] Segment Anything. ICCV 2023.


原文標題:ICCV 2023 | 超越SAM!EntitySeg:更少的數據,更高的分割質量

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2914

    文章

    45008

    瀏覽量

    377710

原文標題:ICCV 2023 | 超越SAM!EntitySeg:更少的數據,更高的分割質量

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    SAM IoT Wx v2硬件用戶指南

    電子發燒友網站提供《SAM IoT Wx v2硬件用戶指南.pdf》資料免費下載
    發表于 01-21 14:02 ?0次下載
    <b class='flag-5'>SAM</b> IoT Wx v2硬件用戶指南

    誠邁科技榮獲vivo 2023年度系統測試業務優秀質量

    近日,誠邁科技以專業的產品質量精神、穩定的交付以及優質的服務,榮獲vivo 2023年度系統測試業務優秀質量獎。誠邁科技再次獲得vivo頒發的該獎項,體現了其在智能終端技術領域的優秀質量
    的頭像 發表于 11-06 16:30 ?434次閱讀

    GB/T6451-2023

    電力變壓器技術參數要求,2023版,有需要的看一下。還有其它的,咋帶附件?
    發表于 11-04 15:49

    畫面分割器怎么調試

    畫面分割器,通常指的是視頻畫面分割器,它是一種可以將一個視頻信號分割成多個小畫面的設備。這種設備廣泛應用于監控系統、視頻會議、多畫面顯示等場景。調試畫面分割器是一個技術性很強的工作,需
    的頭像 發表于 10-17 09:32 ?558次閱讀

    畫面分割器怎么連接

    器的基本原理 畫面分割器的工作原理是通過數字信號處理技術,將多個視頻信號源(如攝像頭、DVR等)的圖像數據進行處理,然后在一個監視器上以分割的形式顯示出來。這些分割可以是1畫面、4畫面
    的頭像 發表于 10-17 09:29 ?442次閱讀

    使用更少的輸入來監控誤差信號

    電子發燒友網站提供《使用更少的輸入來監控誤差信號.pdf》資料免費下載
    發表于 09-20 09:04 ?0次下載
    使用<b class='flag-5'>更少</b>的輸入來監控誤差信號

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。 一、圖像語義分割的基本原理 1.1
    的頭像 發表于 07-17 09:56 ?556次閱讀

    圖像分割和語義分割的區別與聯系

    圖像分割和語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個區域或對象的過程。這些區域或對象具有相似的屬性
    的頭像 發表于 07-17 09:55 ?1213次閱讀

    機器學習中的數據分割方法

    在機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據分割的方法,包括常見的
    的頭像 發表于 07-10 16:10 ?2203次閱讀

    圖像分割與語義分割中的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心模型,在圖像分割與語義分割中發揮著至關重要的
    的頭像 發表于 07-09 11:51 ?1205次閱讀

    天馬榮獲海微科技頒發“2023年度優秀質量獎”和“2023年度保供獎”

    近日,天馬榮獲海微科技頒發的“2023年度優秀質量獎”和“2023年度保供獎”,頒獎儀式在深圳天馬產業基地研發樓舉行。頒獎嘉賓由海微科技供應商質量負責人張浩武擔任,出席頒獎儀式的嘉賓有
    的頭像 發表于 06-17 16:16 ?786次閱讀

    工業異常檢測超越特定閾值限制的解決方案

    異常檢測和分割(AD&S)對于工業質量控制至關重要。雖然現有方法在為每個像素生成異常分數方面表現出色,但實際應用需要產生一個二進制分割來識別異常。
    發表于 04-09 10:44 ?660次閱讀
    工業異常檢測<b class='flag-5'>超越</b>特定閾值限制的解決方案

    天馬榮獲小米“2023年度質量獎”

    近日,天馬微電子股份有限公司(以下簡稱“天馬”)在武漢天馬OLED基地隆重舉行頒獎儀式,榮獲小米公司頒發的“2023年度質量獎”。這一榮譽的獲得,不僅是對天馬在產品質量和技術創新方面卓越表現的肯定,也標志著天馬與小米作為重要戰略
    的頭像 發表于 03-11 10:26 ?1514次閱讀

    天馬微電子榮獲小米“2023年度質量獎”

    近日,天馬榮獲小米“2023年度質量獎”,頒獎儀式在武漢天馬OLED基地舉行。
    的頭像 發表于 03-08 16:42 ?1182次閱讀

    華為首次超越蘋果成為國內平板電腦市場出貨量第一

    近日,國際數據公司(IDC)發布了2023年第四季度中國平板電腦季度跟蹤報告,其中顯示,華為首次超越蘋果成為國內平板電腦市場出貨量第一。
    的頭像 發表于 02-22 09:19 ?949次閱讀
    華為首次<b class='flag-5'>超越</b>蘋果成為國內平板電腦市場出貨量第一
    主站蜘蛛池模板: 牛牛a级毛片在线播放 | 狠狠色影院 | 国内色视频 | 人人爽天天爽夜夜爽qc | 三级视频网站在线观看播放 | 1区2区3区| 国产精品伦理一区二区三区 | 日韩毛片免费视频 | 色性综合 | 狠狠操精品视频 | 好紧好湿好黄的视频 | 欧美黄色成人 | 亚洲va中文字幕 | 久久天天躁狠狠躁狠狠躁 | 色噜噜狠狠大色综合 | 亚洲一区日韩一区欧美一区a | 色精品一区二区三区 | 男人操女人的网站 | 色婷婷久久合月综 | 久久婷婷色一区二区三区 | 欧美极品xxxxⅹ另类 | 国产婷婷综合丁香亚洲欧洲 | 亚洲天堂网在线观看 | 女人69xxx| 欧美第一网站 | 日韩一级黄色录像 | 国产理论视频在线观看 | 免费福利影院 | 欧美三级日韩三级 | 欧美一区二区高清 | 四虎在线播放免费永久视频 | 一区二区三区四区在线 | 四虎影院4hu | 91av免费观看 | 五月天激激婷婷大综合丁香 | 666精品国产精品亚洲 | 米奇777色狠狠8888影视 | 色婷婷综合激情 | 韩国三级中文 | 哥也操| 日本黄色免费片 |