隨著Halcon新版本的更新,截止2019年5月1號。Halcon的最新版本為halcon18.11.這次新版本最大的更新在于完整的加入了深度學習在視覺應用的三個重要部分,即目標分類分類、目標檢測、語義分割這三個內容。與此同時超人視覺即將向大家簡介Halcon軟件這三個方向的應用示例,幫助大家進一步認識到機器視覺的魅力與當前的機器視覺技術的應用前沿。
在開始內容前我們先明確一下前面提到的三個重要概念即深度學習下的分類,目標檢測、語義分割這三個方向具體的概念及其應用場景是什么?幫助大家理解其技術的產生背景以及形成自己的理解。
1圖像分類
圖像分類這一類問題常用與區分不同的物品,圖像分類,顧名思義,是一個輸入圖像,輸出對該圖像內容分類的描述的問題。它是視覺方向的其中一個核心,實際應用廣泛。許多同學在學習計算機視覺中有一個練習題是練習如何區分貓狗如圖1所示:
我們觀察一下這些圖片的特點,這些圖片各種各樣,分辨率也各不相同。圖片中的貓和狗形狀、所處位置、體表顏色各不一樣。它們的姿態不同,有的在坐著而有的則不是,它們的情緒可能是開心的也可能是傷心的,貓可能在睡覺,而狗可能在汪汪地叫著。照片可能以任一焦距從任意角度拍下。
總而言之這些圖片有著無限種可能,對于我們人類來說在一系列不同種類的照片中識別出一個場景中的寵物自然是毫不費力的事情,然而這對于一臺機器來說可不是一件小事。實際上,如果要機器實現自動分類,那么我們需要知道如何強有力地描繪出貓和狗的特征,也就是說為什么我們認為這張圖片中的是貓,而那張圖片中的卻是狗。這個需要描繪每個動物的內在特征。
1.在傳統的分類方法下圖像分類是特征描述及檢測,這類傳統方法可能對于一些簡單的圖像分類是有效的,但由于實際情況非常復雜,傳統的分類方法不堪重負。深度學習下的神經網絡在圖像分類任務上效果很好的原因是,它們有著能夠自動學習多重抽象層的能力,神經網絡可以識別極端變化的模式,在扭曲的圖像和經過簡單的幾何變換的圖像上也有著很好的魯棒性。
2目標檢測
圖像分類是將圖像劃分為單個類別,通常對應于圖像中最突出的物體。但是現實世界的很多圖片通常包含不只一個物體,此時如果使用圖像分類模型為圖像分配一個單一標簽其實是非常粗糙的,并不準確。對于這樣的情況,就需要目標檢測模型,目標檢測模型可以識別一張圖片的多個物體,并可以定位出不同物體并且給出邊界框。目標檢測在很多場景有用,如無人駕駛和安防系統。
傳統的目標檢測的算法多用模板匹配完成,但是模板匹配針對復雜場景下下的識別并不良好,特別是在光照情況不穩定物體有遮擋的情況下算法的魯棒性如何確保一直是傳統視覺算法的一個難題。
由上圖所示,我們可以總結出來目標檢測要解決的核心問題是:1)目標可能出現在圖像的任何位置,2)目標有各種不同的大小,3)目標可能有各種不同的形狀。深度學習在這方面的處理已經部分超越了傳統算法的上限,目前較為先進的深度卷積神經網絡結構,通過其具有局部連接權,值共享及池化操作等功能,有效降低了網絡的復雜度,減少了訓練參數的數目。使模型對于平移、扭曲、縮放具有一定程度不變性并具有較強的魯棒性和容錯能力,且易于訓練與優化的網絡結構。
3.語義分割
語義分割方法在處理圖像時,具體到像素級別,也就是說,該方法會將圖像中每個像素分配到某個對象類別。語義分割是一種典型的計算機視覺問題,其涉及將一些原始數據(例如,平面圖像)作為輸入并將它們轉換為具有突出顯示的感興趣區域的掩模。
許多人使用術語全像素語義分割,其中圖像中的每個像素根據其所屬的感興趣對象被分配類別ID。 早期的計算機視覺問題只發現邊緣(線條和曲線)或漸變等元素,但它們從未完全按照人類感知的方式提供像素級別的圖像理解。語義分割將屬于同一目標的圖像部分聚集在一起來解決這個問題,從而擴展了其應用領域。如圖所示。
語義分割問題也可以被認為是分類問題,其中每個像素被分類為來自一系列對象類中的某一個。因此一個使用案例是利用土地的衛星影像制圖。土地覆蓋信息是重要的各種應用,如監測地區的森林砍伐和城市化等。為了識別衛星圖像上每個像素的土地覆蓋類型(例如,城市、農業、水等區域),土地覆蓋分類可以被視為多級語義分割任務。道路和建筑物檢測也是交通管理,城市規劃和道路監測的重要研究課題。
以上介紹的三個方向是目前深度學習在計算機視覺領域非常火熱的三個研究方。市面上許多網絡教程通過使用開源的視覺開發軟件OpenCV結合Caffe/Tensorflow進行發開,但是對于初學者,這一套開發與部署流程對于剛剛接觸深度學習的同學非常不友好,學習周期漫長并且部署流程繁瑣。德國著名視覺算法軟件開發公司MVtec開發的Halcon算法工具包集成了開發環境。后期將會帶大家了解如何通過Halcon軟件開發包快速上手玩轉當前最火的深度學習三大方向應用。
-
神經網絡
+關注
關注
42文章
4810瀏覽量
102914 -
圖像分類
+關注
關注
0文章
96瀏覽量
12116 -
深度學習
+關注
關注
73文章
5555瀏覽量
122529
原文標題:深度學習在視覺中的應用(1)
文章出處:【微信號:chaorenshijue,微信公眾號:超人Halcon機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
van-自然和醫學圖像的深度語義分割:網絡結構
van-自然和醫學圖像的深度語義分割:網絡結構
自動駕駛深度多模態目標檢測和語義分割:數據集、方法和挑戰

評論