機器視覺是工業4.0,即工業物聯網背景下高度自動化和無縫聯網過程的關鍵技術。使用諸如深度學習之類的新的人工智能過程變得越來越重要。許多好處使這項技術具有吸引力,但同時它也有局限性。
工業生產的自動化正在迅速發展。完全網絡化和數字化的流程鏈在生產車間早已司空見慣。在工業4.0和智能工廠中,所有涉及的組件——包括機器、機器人、傳輸和處理系統、傳感器和圖像采集設備——一起工作,彼此無縫通信。機器人領域也出現了一種新趨勢:小型、緊湊的移動機器人,即協作機器人(collaborative robots, cobots)正在加入生產流程,并經常與人類同事密切合作。cobots的最大好處是,它們可以快速地重新裝備,并且只需很少的工作,這使得靈活地使用它們來完成不同的生產任務成為可能。
伴隨并支持整個價值創建過程的互補技術在這些高度自動化的場景中扮演著重要的角色。這些包括,例如,可編程邏輯控制器(plc)和機器視覺。后者作為“生產之眼”實時觀察和監控生產過程。圖像采集設備,如相機、掃描儀和3D傳感器,被放置在多個位置,并從不同的角度記錄過程。生成的數字圖像數據通過集成的機器視覺軟件進行處理,可用于處理鏈中的各種任務。例如,可以根據光學特性可靠地檢測目標并精確定位。該技術還可以檢測產品的制造故障,從而自動排除故障,從而優化質量保證流程。
基于卷積神經網絡(CNNs)架構的深度學習
越來越多的先進人工智能(AI)技術被納入機器視覺系統。其中一項技術是基于卷積神經網絡(CNN)體系結構的深度學習。大量的數字圖像信息用于廣泛的培訓過程。基于這些數據,軟件可以獨立地對新對象進行分類。在訓練過程中,自動學習特定對象類的特征。因此,新的圖像數據可以精確地分配給它們的特定類別,從而產生非常高和強大的識別率。這些深度學習算法也適用于精確目標 定位 和缺陷識別。
機器視覺是“生產之眼”
深度學習技術注定要在機器視覺應用程序的某些領域使用。這些主要包括分類、對象檢測和語義分割。這就是智能算法的優勢所在。然而,在其他機器視覺應用中,深度學習的適用性有一定的局限性。由于需要分析大量的數據,訓練過程通常需要非常大的計算能力和適當尺寸的硬件。特別是在時間非常關鍵的應用程序中,標準CPU通常是不夠的。不適用于高速應用程序,例如高精度測量任務和具有毫米或微米精度的目標定位。在這種情況下,深度學習算法在一個標準CPU上需要50到100毫秒。然而,這種精確定位只需要幾毫秒。這里需要的是一個功能強大的GPU, 通常 GPU是不適用于工業用途的硬件。
深度學習并非適用于所有應用
在工業應用中,深度學習也不是最佳選擇,例如在電子和半導體工業中,要檢測或識別的對象與實際情況非常相似。由于這些組件通常具有非常相似的外觀,因此使用傳統機器視覺方法進行培訓只需要幾個示例圖像。在許多情況下,即使是單個圖像也足以可靠地檢測到對象并精確定位它們。然而,只有當每個對象至少有100個訓練圖像可用時,使用深度學習算法才有意義。因此,使用常規方法(如基于規則的軟件技術)可以更好地解決機器視覺任務,其中要識別的對象非常相似。特別是對于讀取數據代碼和條形碼,采用啟發式算法而不是深度學習算法。對目標的度量,如亞像素精確輪廓提取,也依賴于啟發式算法。
深度學習可以提高識別率
然而,在深度學習能夠帶來全部好處的應用中,必須考慮某些挑戰。深度學習是一種相對較新的技術,市場對其提供的通用標準很少。此外,深度學習的整體處理非常復雜,需要深入的知識以及在人工智能、編程和機器視覺領域的多年經驗。這通常超出了一般公司的能力,因為他們缺乏必要的專業人才。
通過預先培訓的深度學習網絡減少工作量
然而,有些公司可以通過合理的努力從深度學習中獲益。例如,他們可以利用預先培訓的深度學習網絡。為此,市場上提供了許多免費的開源解決方案。不過,使用它們還是有一些陷阱。例如,可能會出現許可證問題。通常需要幾十萬個樣本圖像來精確識別物體。之所以需要如此多的特征,是因為許多不同的特征,如顏色、形狀、紋理和表面結構,對識別過程至關重要。在選擇如此大量的圖像時,確保它們不受開源產品很少保證的第三方權利的約束是很重要的。
使用開源工具的另一個挑戰是,它們通常只單獨執行某些機器視覺任務,很難集成到其他應用程序或現有框架中。典型的機器視覺問題通常涉及幾個步驟。首先,必須將來自圖像采集設備的數字圖像數據提供給特定應用程序。然后在第二個步驟中對數據進行預處理,在該步驟中,圖像被優化定向以將對象放置在所需的位置。最后,處理后的數據被集成到其他解決方案中,例如PLC,這樣就可以無縫地將結果用于其他流程步驟。這就是開源系統達到其極限的地方。
標準專有軟件有很多優點
已經擁有預先培訓的網絡的專有標準軟件解決方案是機器視覺的更實用的選擇。這些解決方案包括配備培訓深度學習網絡的所有重要功能的軟件。基于其廣泛的功能和專門配置的工具,它可以最佳地集成到其他應用程序中。該解決方案包括多個網絡,這些網絡已根據工業環境中大約一百萬個精心挑選的免許可證圖像進行了預先培訓。公司只需要一些額外的圖像就可以根據自己的特定應用定制網絡培訓流程。這大大減少了培訓工作,節省了資金,并避免了與圖像權利相關的風險。
通過深度學習,可以精確地檢測物體。圖像來源:MVTec Software GmbH
使用開源工具是另一個挑戰。深度學習應用程序通常包含數十萬行編程代碼。要正確操作,此代碼必須滿足某些質量標準。使用一個未知社區開發的開源代碼會在這方面產生一定的風險。為了安全起見,公司需要在內部檢查代碼以確定其質量。由于大量的代碼,這項任務非常勞動密集,并且產生了幾乎無法計算的成本。然而,使用專有的商業解決方案,公司可以從高質量、經過測試和安全的代碼中獲益。如果需要支持的話,專業顧問和專家是可以利用的,這在開放的社區中是不可指望的。
結論
在數字化時代和工業物聯網時代,機器視覺是高度自動化和網絡化生產過程中不可或缺的伴隨技術。基于AI的技術,如深度學習和CNN,是這些機器視覺解決方案的重要組成部分。但是,請務必記住它們僅適用于某些應用程序。公司還應該仔細考慮開源系統是否足以滿足他們的要求,或者是否值得花時間投資商業的專有軟件解決方案。
-
機器視覺
+關注
關注
163文章
4532瀏覽量
122792 -
人工智能
+關注
關注
1806文章
48980瀏覽量
248839 -
深度學習
+關注
關注
73文章
5560瀏覽量
122745
原文標題:用于目標識別的自學習機器視覺系統
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
基于RV1126開發板實現自學習圖像分類方案

廠家芯資訊|WTK6900系列語音識別芯片自學習功能深度答疑

芯資訊|WTK6900系列語音識別芯片IC自學習功能解析

協作機器人TM25S:內置視覺系統實現精準作業

《DNK210使用指南 -CanMV版 V1.0》第四十八章 自學習分類實驗
適用于機器人視覺系統的LED光源

評論