在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沒你想的那么難 | 一文讀懂圖像分割

穎脈Imgtec ? 2023-05-16 09:21 ? 次閱讀

來源:圖靈Topia(ID:turingtopia)


圖像分割(Image Segmentation)是計算機視覺領域中的一項重要基礎技術,是圖像理解中的重要一環。近日,數據科學家Derrick Mwiti在一篇文章中,就什么是圖像分割、圖像分割架構、圖像分割損失函數以及圖像分割工具和框架等問題進行了討論,讓我們一探究竟吧。

42b820f2-f0a8-11ed-ba01-dac502259ad0.jpg


什么是圖像分割?

顧名思義,這是將一個圖像分割成多個片段的過程。在這個過程中,圖像中的每個像素都與一個對象類型相關聯。圖像分割主要有兩種類型:語義分割和實例分割。

在語義分割中,同一類型的所有對象都使用一個類標簽進行標記,而在實例分割中,相似的對象使用各自獨立的標簽。

42d13c4a-f0a8-11ed-ba01-dac502259ad0.jpg


圖像分割的體系結構

圖像分割的基本結構包括編碼器和解碼器。

42e5767e-f0a8-11ed-ba01-dac502259ad0.jpg編碼器通過過濾器從圖像中提取特征。解碼器負責生成最終的輸出,通常是一個包含對象輪廓的分割掩碼。大多數體系結構都有這種結構或其變體,看幾個例子:U-NetU-Net是最初用于分割生物醫學圖像的卷積神經網絡。可視化時,其架構看起來像字母U,因此名稱為U-Net。它的體系結構由兩部分組成,左邊部分是收縮路徑,右邊部分是擴展路徑。收縮路徑的目的是捕獲上下文,而擴展路徑的作用是幫助精確定位。42f67d98-f0a8-11ed-ba01-dac502259ad0.jpgU-Net由右邊的擴展路徑和左邊的收縮路徑組成。收縮路徑由兩個3×3的卷積組成,卷積之后是一個整流的線性單元和一個用于降采樣的兩乘二最大池計算。

完整的U-Net實現可以在這里找到

https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

FastFCN —Fast Fully-connected network

在這種結構中,聯合金字塔上采樣(JPU)模塊被用來代替擴展卷積,因為它們消耗大量的內存和時間。它的核心是一個全連接網絡,同時使用JPU進行上采樣。JPU將低分辨率特征圖提升為高分辨率特征圖。430ce98e-f0a8-11ed-ba01-dac502259ad0.jpg如果你想進行代碼實現,鏈接如下:https://github.com/wuhuikai/FastFCNGated-SCNN該架構由雙流CNN架構組成。在此模型中,一個單獨的分支用于處理圖像形狀信息。形狀流用于處理邊界信息。432bab80-f0a8-11ed-ba01-dac502259ad0.jpg

你可以通過檢查這里的代碼來實現:

https://github.com/nv-tlabs/gscnnDeepLab在這種結構中,卷積與上采樣濾波器用于涉及密集預測的任務。多個對象的分割是通過空間金字塔池來完成的。最后,用DCNNs改進對象邊界的定位。通過插入零點或對輸入特征圖進行稀疏采樣來對濾波器進行上采樣,從而實現空洞卷積。433f39f2-f0a8-11ed-ba01-dac502259ad0.jpg

可以在PyTorch或TensorFlow上嘗試其實現。

PyTorch:https://github.com/fregu856/deeplabv3

TensorFlow:https://github.com/sthalles/deeplab_v3

Mask R-CNN在這種體系結構中,使用bounding box和語義分割對對象進行分類和定位,并將每個像素分類為一組類別。每個感興趣的區域都有一個分割掩碼,最終的輸出是一個類標簽和一個bounding box。該體系結構是Faster R-CNN的擴展,Faster R-CNN由提出區域的深度卷積網絡和利用區域的檢測器組成。4358d8b2-f0a8-11ed-ba01-dac502259ad0.jpg這是在COCO測試集上得到的結果的圖像

43717f70-f0a8-11ed-ba01-dac502259ad0.jpg

圖像分割損失函數

語義分割模型在訓練過程中通常使用一個簡單的交叉熵損失函數。但是,如果對獲取圖像的粒度信息感興趣,則必須恢復到稍微高級一些的損失函數,來看幾個例子:

Focal Loss

這種損失是對標準交叉熵準則的改進。這是通過改變其形狀來實現的,使得分配給分類良好的示例的損失權重降低了。最終,確保不存在類不平衡。

在這個損失函數中,交叉熵損失是會隨著縮放系數衰減為零而縮,訓練時,比例因數自動降低了簡單示例的權重,并將重點放在困難示例上。

43973ac6-f0a8-11ed-ba01-dac502259ad0.png

Dice loss

該損失是通過計算平滑dice coefficient函數獲得的。這種損失是最常用的損失,是分割問題。

43b12026-f0a8-11ed-ba01-dac502259ad0.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度,降低低IoU樣本的梯度。從而提高了機器學習模型的定位精度。

43c8e6e8-f0a8-11ed-ba01-dac502259ad0.png

Boundary loss

Boundary loss的一種變體應用于具有高度不平衡分段的任務。

這種損失的形式是空間輪廓而非區域上的距離度量。通過這種方式,它解決了高度不平衡的分割任務的區域損失所帶來的問題。

43e7d080-f0a8-11ed-ba01-dac502259ad0.png

Weighted cross-entropy

在交叉熵的一個變體中,所有正例均按一定系數加權。它用于涉及類不平衡的方案。

43fb2766-f0a8-11ed-ba01-dac502259ad0.png

Lovász-Softmaxloss

該損失基于子模塊損失的convex Lovasz擴展,對神經網絡中的intersection-over-union loss進行了直接優化。

441f09ba-f0a8-11ed-ba01-dac502259ad0.png其他值得一提的損失有:TopK loss:其目標是確保網絡在訓練過程中專注于困難樣本。Distance penalized CE loss:它將網絡引向難以分割的邊界區域。Sensitivity-Specificity (SS) loss:計算特異性和敏感性的均方差的加權和。Hausdorff distance(HD) loss:可從卷積神經網絡估計Hausdorff距離。

這些是在圖像分割中使用的一些損失函數。了解更多,請查看

https://github.com/JunMa11/SegLoss。


圖像分割的數據集

Common Objects in COntext—Coco Dataset

COCO是一個大型的對象檢測、分割和字幕數據集。數據集包含91個類。它有25萬人,都有自己的關鍵點。它的下載大小是37.57 GiB。它包含80個對象類別。它在Apache 2.0的許可下可用,可以從這里下載。

http://cocodataset.org/#download

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20個不同的類,9963張圖片。訓練/驗證集是一個2GB的tar文件。數據集可以從官方網站下載。

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

The Cityscapes Dataset

這個數據集包含城市場景的圖像。該方法可用于評價視覺算法在城市場景中的性能。數據集可以從這里下載。

https://www.cityscapes-dataset.com/downloads/

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個基于動作的分割和識別數據集。它包含32個語義類。以下鏈接包含數據集的進一步說明和下載鏈接。

http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/


圖像分割框架

如果準備好了數據集,那么來談談一些可用于入門的工具/框架。FastAI庫:給定一個圖像,該庫能夠為圖像中的對象創建掩碼。Sefexa圖像分割工具:可用于半自動圖像分割,圖像分析和創建地面實況。Deepmask:Facebook Research的Deepmask是DeepMask和SharpMask的Torch實現。MultiPath:這是一個Torch實現,從“用于目標檢測的多路徑網絡”中提取目標檢測網絡。OpenCV :這是一個開放源代碼的計算機視覺庫,具有2500多種優化算法。MIScnn:醫學圖像分割開源庫。它允許在幾行代碼中使用最新的卷積神經網絡和深度學習模型建立管道。

Fritz:提供了多種計算機視覺工具,包括用于移動設備的圖像分割工具。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1094

    瀏覽量

    41071
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18275
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    讀懂!圖像采集卡是什么?它在工業/醫療/監控等多領域中的作用

    你有沒有想過,在工業檢測、醫院手術室、安防監控這些高精度影像場景中,圖像是怎么被“抓”進電腦里進行分析處理的?單靠攝像頭就能搞定嗎?其實并沒那么簡單,真正起到關鍵作用的,是種常被忽視但極其重要的設備——
    的頭像 發表于 05-13 13:35 ?441次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>!<b class='flag-5'>圖像</b>采集卡是什么?它在工業/醫療/監控等多領域中的作用

    rootfs鏡像制作其實那么

    在嵌入式Linux開發中,文件系統的打包和鏡像制作是關鍵步驟。本文介紹了Linux核心板文件系統的打包與鏡像制作方法,適合嵌入式開發人員快速上手。前言致遠電子Linux核心板提供的系統固件里,除了鏡像文件之外,通常還會提供文件系統壓縮包。鏡像文件可以直接用于燒寫到目標板,而文件系統壓縮包則可以進行部分修改,修改后重新制作鏡像文件燒寫。這里只講直接用編譯好的二
    的頭像 發表于 04-03 11:37 ?357次閱讀
    rootfs鏡像制作其實<b class='flag-5'>沒</b><b class='flag-5'>那么</b><b class='flag-5'>難</b>

    讀懂:LED 驅動電路二極管挑選要點

    讀懂:LED 驅動電路二極管挑選要點
    的頭像 發表于 02-06 14:47 ?496次閱讀

    讀懂什么是「雷電4」

    Thunderbolt讀懂什么是「雷電4」目前大部分PC接口配備了USB接口、音頻接口、HDMI接口等,這些接口的功能基本覆蓋了用戶的日常使用需求。為了提供更高速、更便捷的數據傳輸和設備連接體
    的頭像 發表于 02-05 17:52 ?1911次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>什么是「雷電4」

    讀懂單燈控制器工作原理

    讀懂單燈控制器工作原理
    的頭像 發表于 11-11 13:13 ?1162次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>單燈控制器工作原理

    讀懂MSA(測量系統分析)

    讀懂MSA(測量系統分析)
    的頭像 發表于 11-01 11:08 ?1497次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>MSA(測量系統分析)

    【小白入門必看】讀懂深度學習計算機視覺技術及學習路線

    ,幫我們做決定。整個過程就是為了讓機器能看懂圖像,然后根據這些圖像來做出聰明的選擇。二、計算機視覺實現起來嗎?人類依賴視覺,找輛汽車輕而易舉,畢竟汽車那么大,
    的頭像 發表于 10-31 17:00 ?1140次閱讀
    【小白入門必看】<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>深度學習計算機視覺技術及學習路線

    讀懂新能源汽車的功能安全

    電子發燒友網站提供《讀懂新能源汽車的功能安全.pdf》資料免費下載
    發表于 09-04 09:22 ?3次下載

    讀懂圖像傳感器的選型

    圖像傳感器是將光信號轉換為電信號的芯片,在相機、智能手機、安防監控、汽車電子和機器視覺等市場中有著廣泛的應用。圖像傳感器的工作原理主要基于光電效應。光子通過鏡頭進入傳感器,并被傳感器中的光電二極管
    的頭像 發表于 08-09 16:14 ?1958次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b><b class='flag-5'>圖像</b>傳感器的選型

    圖像語義分割的實用性是什么

    圖像語義分割種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像
    的頭像 發表于 07-17 09:56 ?839次閱讀

    圖像分割和語義分割的區別與聯系

    、亮度等。圖像分割的目的是將圖像中感興趣的部分與背景分離,以便進行進步的處理和分析。 1.1 圖像分割
    的頭像 發表于 07-17 09:55 ?1783次閱讀

    圖像分割與目標檢測的區別是什么

    的區別。 定義 圖像分割是將圖像劃分為若干個區域或對象的過程,這些區域或對象具有相似的屬性,如顏色、紋理或形狀。圖像分割的目的是將
    的頭像 發表于 07-17 09:53 ?2251次閱讀

    圖像分割與語義分割中的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的種核心
    的頭像 發表于 07-09 11:51 ?1817次閱讀

    機器人視覺技術中常見的圖像分割方法

    機器人視覺技術中的圖像分割方法是個廣泛且深入的研究領域。圖像分割是將圖像劃分為多個區域或對象的
    的頭像 發表于 07-09 09:31 ?1298次閱讀

    機器人視覺技術中圖像分割方法有哪些

    機器人視覺技術是人工智能領域的個重要分支,它涉及到圖像處理、模式識別、機器學習等多個學科。圖像分割是機器人視覺技術中的個重要環節,它的目
    的頭像 發表于 07-04 11:34 ?1617次閱讀
    主站蜘蛛池模板: 成人在线a | 四虎国产精品永久地址49 | 欧美成人午夜精品免费福利 | 日本三级日本三级人妇三级四 | 日本激情网 | 生活片一级性 | 两性色午夜视频免费播放 | ⅹxxxx68日本老师hd | www.午夜| 国产成人a毛片 | 人与牲动交xxxxbbbb | 成人看的一级毛片 | 亚洲色图在线播放 | 4438x五月天 4438x亚洲最大 | 九九热国产 | 爱爱小视频免费看 | 综合激情婷婷 | 亚洲性后网 | 久久精品国产99久久72 | 搞黄视频网站 | 黄色a网站 | 亚洲情a成黄在线观看动 | 四虎影院在线观看网站 | 黄色理伦| 婷婷六月久久综合丁香一二 | 欧美影院一区二区 | 国产高清一级视频在线观看 | 婷婷久久五月天 | 1024 cc香蕉在线观看看中文 | 色黄视频 | 五月婷婷 六月丁香 | 222www在线观看免费 | 日本黄色免费网站 | 无遮挡很爽很污很黄在线网站 | 濑亚美莉vs黑人欧美视频 | 女主播扒开内衣让粉丝看个够 | 天天天天色 | 亚洲一级特黄 | 中国三级视频 | 俺也来国产精品欧美在线观看 | 免费高清视频免费观看 |