垃圾分類作為資源回收利用的重要環節之一,可以有效地提高資源回收利用效率,進一步減輕環境污染帶 來的危害.隨著現代工業逐步智能化,傳統的圖像分類算法已經不能滿足垃圾分揀設備的要求.本文提出一種基于 卷積神經網絡的垃圾圖像分類模型 (GarbageClassificationNetwork,GCNet).通過構建注意力機制,模型完成局部 和全局的特征提取,能夠獲取到更加完善、有效的特征信息;同時,通過特征融合機制,將不同層級、尺寸的特征進 行融合,更加有效地利用特征,避免梯度消失現象.實驗結果證明,GCNet 在相關垃圾分類數據集上取得了優異的 結果,能夠有效地提高垃圾識別精度.
1引言
垃圾回收利用作為發展循環經濟的必經之路,是 根治污染、提高環境治理效果的關鍵所在.隨著我國 生產力水平的發展,生活垃圾、工業垃圾數量不斷增 加,困擾著很多城市.據統計,僅 2018 年,中國垃圾的 清運量已經達到了 2.28 億噸[1] .在人們將垃圾投放進垃圾箱之后,垃圾被運送到垃圾處理廠統一處理.當前 國內的垃圾處理廠,更多依靠人工在流水線上作業去 分揀垃圾,對作業者健康不利且分揀效率較低,已不能 滿足大量垃圾處理需求.此外,人工分揀的垃圾種類極 為有限,大部分垃圾無法重新回收利用,造成很大浪費. 隨著深度學習技術的發展,卷積神經網絡使圖像分類 算法在精度和速度上得到了巨大的提升,讓我們看到 了借助視覺技術自動分揀垃圾的可能性.通過攝像頭 拍攝垃圾圖片,利用卷積神經網絡檢測出垃圾的類別, 之后就可以借助機械手或推板自動完成分揀任務,可 以降低人工成本,提高分揀效率.因此,開展垃圾圖像 分類算法的研究,具有重要的應用價值.
2相關工作
早期,學者們只能借助經典的圖像分類算法[2–5] 完 成垃圾圖像分類任務,這要通過手動提取的圖像特征 并結合相應的分類器完成.吳健等[6] 利用顏色和紋理 特征,初步完成了廢物垃圾識別.由于不同數據集的圖 像背景、尺寸、質量不盡相同,傳統算法需要根據相 應數據人工提取不同的特征,算法的魯棒性較差,并且 處理方式復雜,所需時間較長,無法達到實時的效果. 隨著卷積神經網絡 (ConvolutionNeuralNetwork, CNN) 的飛速發展,深度學習廣泛應用于圖像識別領 域.作為數據驅動的算法,CNN 具有強大的特征擬合 能力,可以有效、自動地提取圖像特征,并具有較快的 運行速度.2012 年,AlexNet[7] 取得了 ImageNet 圖像分 類競賽的冠軍,標志著深度學習的崛起.隨后幾年, GoogleNet[8]、VGGNet[9]、ResNet[10] 等算法提升了圖 像分類的精度,并成功應用于人臉識別、車輛檢測等 多個領域.垃圾圖像分類,在深度學習算法的幫助下同 樣取得了較大的突破.斯坦福大學的 Yang 等建立了 TrashNetDataset 公開數據集,包含 6 個類別,共計 2527 張圖片.Ozkaya 等[11] 通過對比不同 CNN 網絡的 分類能力,搭建神經網絡 (本文稱之為 TrashNet) 并進 行參數微調,在數據集 TrashNetDataset 上取得了 97.86% 的準確率,是目前這一數據集上最佳分類網絡.在非公 開數據集方面,Mittal 等[12] 自制了 2561 張的垃圾圖片 數據集 GINI,使用 GarbNet 模型,得到了 87.69% 的準 確率.國內方面,鄭海龍等[13] 用 SVM 方法進行了建筑 垃圾分類方面的研究.向偉等[14] 使用分類網絡 CaffeNet, 調整卷積核尺寸和網絡深度,使其適用于水面垃圾分 類,在其自制的 1500 張圖片數據集上取得了 95.75% 的識別率.2019 年,華為舉辦垃圾圖像分類競賽,構建 了樣本容量為一萬余張的數據集,進一步促進了該領 域的發展. 我國各地區生活垃圾分類標準有所不同,大致可 分為可回收垃圾、有害垃圾、廚余垃圾和其他垃圾這 4 大類,且每個類別下又包含若干子類別,種類繁多且 十分復雜.按照這樣的分類標準做的垃圾圖像識別研 究,國內目前還處于起步階段.現有的圖形分類算法在 垃圾處理領域的應用較少,且存在準確率不足、泛化 性能差、處理效率低的缺點.針對現有方法的不足,本 文提出一種基于卷積神經網絡的垃圾圖像分類算法 (GarbageClassificationNet,GCNet),在網絡結構中融合 了注意力機制模塊與特征融合模塊,提高了模型在垃 圾分類任務上的準確性與魯棒性.
3算法設計
3.1 模型結構
本文構建的 GCNet 模型包括特征提取器、分類 器兩部分,整體結構如圖 1 所示.圖中特征提取器由 Resnet101 作為主干部分,共包括 5 個 bottleneck,并在 不同的 bottleneck 后加入注意力機制模塊,同時對不同 模塊提取到的特征進行特征融合 (如圖 1 中虛線所示) 以從輸入 中提取圖像的特征信息 :
其中,Me表示特征提取器. F1 yi 分類器由兩層全連接層和一個 Softmax 分類器組 成,對提取到的特征信息 進行分類,以得到圖像在每 個類別下的最終得分 :
其中,Mc表示分類器.
3.2 注意力機制
注意力機制源于對人類視覺的研究,人類會根據 實際需要選擇視網膜內特定區域進行集中關注,可以 將有限的處理資源分配至重要的部分.由于相同類別 垃圾的特征表征差異性可能較大,不利于圖片的正確 分類,這就要求準確地關注圖像中的顯著區域.受這一 思想的啟發,通過構建注意力機制模塊,使網絡模型重 點關注有利于分類的特征區域,以實現更好的特征提 取功能,其具體結構如圖 2 所示.
5結論
本文針對垃圾圖像分類問題,構建了一種基于卷 積神經網絡的算法 GCNet,該網絡通過構建注意力機 制和特征融合機制,能夠有效地提取圖像特征、降低 類別差異性帶來的影響,并在相關數據集上取得了 96.73% 的平均準確率,相較于現有的分類算法提升了 約 4% 的準確率,滿足了實際的應用需求,具有良好的 應用前景.
審核編輯:郭婷
-
神經網絡
+關注
關注
42文章
4793瀏覽量
102040 -
攝像頭
+關注
關注
60文章
4910瀏覽量
97259
原文標題:基于卷積神經網絡的垃圾圖像分類算法
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論