盛世嫡妃凤轻小说,yy玄幻小说排行榜完本,魔天记忘语小说

計算機視覺：

圖像檢測和圖像分割有什么區別？

人工智能對于圖像處理有不同的任務。在本文中，我將介紹目標檢測和圖像分割之間的區別。

在這兩個任務中，我們都希望找到圖像中某些感興趣的項目的位置。例如，我們可以有一組安全攝像頭照片，在每張照片上，我們想要識別照片中所有人的位置。

通常有兩種方法可以用于此：目標檢測（Object Detection）和圖像分割（Image Segmentation）。

目標檢測-預測包圍盒

當我們說到物體檢測時，我們通常會說到邊界盒。這意味著我們的圖像處理將在我們的圖片中識別每個人周圍的矩形。

邊框通常由左上角的位置（2 個坐標）和寬度和高度（以像素為單位）定義。

來自開放圖像數據集的注釋圖像。家庭堆雪人，來自 mwvchamber。在CC BY 2.0許可下使用的圖像。

如何理解目標檢測
如果我們回到任務：識別圖片上的所有人，則可以理解通過邊界框進行對象檢測的邏輯。
我們首先想到的解決方案是將圖像切成小塊，然后在每個子圖像上應用圖像分類，以區別該圖像是否是人類。對單個圖像進行分類是一項較容易的任務，并且是對象檢測的一項，因此，他們采用了這種分步方法。
當前，YOLO模型（You Only Look Once）是解決此問題的偉大發明。YOLO模型的開發人員已經構建了一個神經網絡，該神經網絡能夠立即執行整個邊界框方法！

當前用于目標檢測的最佳模型
YOLO
Faster RCNN

目標分割-預測掩模

一步一步地掃描圖像的邏輯替代方法是遠離畫框，而是逐像素地注釋圖像。

如果你這樣做，你將會有一個更詳細的模型，它基本上是輸入圖像的一個轉換。

來自開放圖像數據集的注釋圖像。家庭堆雪人，來自 mwvchamber。在CC BY 2.0許可下使用的圖像。

如何理解圖像分割
這個想法很基本：即使在掃描產品上的條形碼時，也可以應用一種算法來轉換輸入信息（通過應用各種過濾器），這樣，除了條形碼序列以外的所有信息在最終圖像中都不可見。

這是在圖像上定位條形碼的基本方法，但與在圖像分割中所發生的情況類似。
圖像分割的返回格式稱為掩碼:與原始圖像大小相同的圖像，但是對于每個像素，它只有一個布爾值來指示對象是否存在。
如果我們允許多個類別，它就會變得更加復雜：例如，它可以將一個海灘景觀分為三類：空氣、海洋和沙子。

當下圖像分割的最佳模型
Mask RCNN
Unet
Segnet

比較總結

	對象檢測輸入是一個矩陣(輸入圖像)，每個像素有 3 個值(紅、綠、藍)，如果是黑色和白色，則每個像素有 1 個值輸出是由左上角和大小定義的邊框列表
	圖像分割輸入是一個矩陣(輸入圖像)，每個像素有 3 個值(紅、綠、藍)，如果是黑色和白色，則每個像素有 1 個值輸出是一個矩陣(掩模圖像)，每個像素有一個包含指定類別的值

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

圖像處理

圖像處理

+關注

關注
27

文章
1328

瀏覽量
58168
圖像分割

圖像分割

+關注

關注
4

文章
182

瀏覽量
18375
圖像檢測

圖像檢測

+關注

關注
0

文章
35

瀏覽量
12066

原文標題：計算機視覺：圖像檢測和圖像分割有什么區別？

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

目標檢測和圖像分割之間的區別

評論