在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

目標檢測:Faster RCNN算法詳解

ss ? 來源:shenxiaolu1984 ? 作者:shenxiaolu1984 ? 2021-01-13 16:25 ? 次閱讀

本文是繼RCNN[1],fast RCNN[2]之后,目標檢測界的領軍人物Ross Girshick團隊在2015年的又一力作。簡單網絡目標檢測速度達到17fps,在PASCAL VOC上準確率為59.9%;復雜網絡達到5fps,準確率78.8%。

作者在github上給出了基于matlabpython的源碼。對Region CNN算法不了解的同學,請先參看這兩篇文章:《RCNN算法詳解》,《fast RCNN算法詳解》。

思想

從RCNN到fast RCNN,再到本文的faster RCNN,目標檢測的四個基本步驟(候選區域生成,特征提取,分類,位置精修)終于被統一到一個深度網絡框架之內。所有計算沒有重復,完全在GPU中完成,大大提高了運行速度。

faster RCNN可以簡單地看做“區域生成網絡+fast RCNN“的系統,用區域生成網絡代替fast RCNN中的Selective Search方法。本篇論文著重解決了這個系統中的三個問題:

如何設計區域生成網絡

如何訓練區域生成網絡

如何讓區域生成網絡和fast RCNN網絡共享特征提取網絡

區域生成網絡:結構

基本設想是:在提取好的特征圖上,對所有可能的候選框進行判別。由于后續還有位置精修步驟,所以候選框實際比較稀疏。

特征提取

原始特征提取(上圖灰色方框)包含若干層conv+relu,直接套用ImageNet上常見的分類網絡即可。本文試驗了兩種網絡:5層的ZF[3],16層的VGG-16[[^-4]],具體結構不再贅述。

額外添加一個conv+relu層,輸出5139256維特征(feature)。

候選區域(anchor)

特征可以看做一個尺度5139的256通道圖像,對于該圖像的每一個位置,考慮9個可能的候選窗口:三種面積{ 12 8 2 , 25 6 2 , 51 2 2 } × \{128^2, 256^2, 512^2 \}\times{1282,2562,5122}×三種比例{ 1 : 1 , 1 : 2 , 2 : 1 } \{ 1:1, 1:2, 2:1\}{1:1,1:2,2:1}。這些候選窗口稱為anchors。下圖示出5139個anchor中心,以及9種anchor示例。

在整個faster RCNN算法中,有三種尺度。

原圖尺度:原始輸入的大小。不受任何限制,不影響性能。

歸一化尺度:輸入特征提取網絡的大小,在測試時設置,源碼中opts.test_scale=600。anchor在這個尺度上設定。這個參數和anchor的相對大小決定了想要檢測的目標范圍。

網絡輸入尺度:輸入特征檢測網絡的大小,在訓練時設置,源碼中為224*224。

窗口分類和位置精修

分類層(cls_score)輸出每一個位置上,9個anchor屬于前景和背景的概率;窗口回歸層(bbox_pred)輸出每一個位置上,9個anchor對應窗口應該平移縮放的參數。

對于每一個位置來說,分類層從256維特征中輸出屬于前景和背景的概率;窗口回歸層從256維特征中輸出4個平移縮放參數。

就局部來說,這兩層是全連接網絡;就全局來說,由于網絡在所有位置(共51*39個)的參數相同,所以實際用尺寸為1×1的卷積網絡實現。

實際代碼中,將51399個候選位置根據得分排序,選擇最高的一部分,再經過Non-Maximum Suppression獲得2000個候選結果。之后才送入分類器和回歸器。

所以Faster-RCNN和RCNN, Fast-RCNN一樣,屬于2-stage的檢測算法。

區域生成網絡:訓練

樣本

考察訓練集中的每張圖像:

a. 對每個標定的真值候選區域,與其重疊比例最大的anchor記為前景樣本

b. 對a)剩余的anchor,如果其與某個標定重疊比例大于0.7,記為前景樣本;如果其與任意一個標定的重疊比例都小于0.3,記為背景樣本

c. 對a),b)剩余的anchor,棄去不用。

d. 跨越圖像邊界的anchor棄去不用

代價函數

同時最小化兩種代價:

a. 分類誤差

b. 前景樣本的窗口位置偏差

具體參看fast RCNN中的“分類與位置調整”段落。

超參數

原始特征提取網絡使用ImageNet的分類樣本初始化,其余新增層隨機初始化。

每個mini-batch包含從一張圖像中提取的256個anchor,前景背景樣本1:1.

前60K迭代,學習率0.001,后20K迭代,學習率0.0001。

momentum設置為0.9,weight decay設置為0.0005。[4]

共享特征

區域生成網絡(RPN)和fast RCNN都需要一個原始特征提取網絡(下圖灰色方框)。這個網絡使用ImageNet的分類庫得到初始參數W 0 W_0W0?,但要如何精調參數,使其同時滿足兩方的需求呢?本文講解了三種方法。

輪流訓練

a. 從W 0 W_0W0?開始,訓練RPN。用RPN提取訓練集上的候選區域

b. 從W 0 W_0W0?開始,用候選區域訓練Fast RCNN,參數記為W 1 W_1W1?

c. 從W 1 W_1W1?開始,訓練RPN…

具體操作時,僅執行兩次迭代,并在訓練時凍結了部分層。論文中的實驗使用此方法。

如Ross Girshick在ICCV 15年的講座Training R-CNNs of various velocities中所述,采用此方法沒有什么根本原因,主要是因為”實現問題,以及截稿日期“。

近似聯合訓練

直接在上圖結構上訓練。在backward計算梯度時,把提取的ROI區域當做固定值看待;在backward更新參數時,來自RPN和來自Fast RCNN的增量合并輸入原始特征提取層。

此方法和前方法效果類似,但能將訓練時間減少20%-25%。公布的python代碼中包含此方法。

聯合訓練

直接在上圖結構上訓練。但在backward計算梯度時,要考慮ROI區域的變化的影響。推導超出本文范疇,請參看15年NIP論文[5]。

實驗

除了開篇提到的基本性能外,還有一些值得注意的結論

與Selective Search方法(黑)相比,當每張圖生成的候選區域從2000減少到300時,本文RPN方法(紅藍)的召回率下降不大。說明RPN方法的目的性更明確。

使用更大的Microsoft COCO庫[6]訓練,直接在PASCAL VOC上測試,準確率提升6%。說明faster RCNN遷移性良好,沒有over fitting。

Girshick, Ross, et al. “Rich feature hierarchies for accurate object detection and semantic segmentation.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2014. ??

Girshick, Ross. “Fast r-cnn.” Proceedings of the IEEE International Conference on Computer Vision. 2015. ??

M. D. Zeiler and R. Fergus, “Visualizing and understanding convolutional neural networks,” in European Conference on Computer Vision (ECCV), 2014. ??

learning rate-控制增量和梯度之間的關系;momentum-保持前次迭代的增量;weight decay-每次迭代縮小參數,相當于正則化。 ??

Jaderberg et al. “Spatial Transformer Networks”

NIPS 2015 ??

30萬+圖像,80類檢測庫。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 目標檢測
    +關注

    關注

    0

    文章

    223

    瀏覽量

    15917
  • 深度學習
    +關注

    關注

    73

    文章

    5555

    瀏覽量

    122527
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基于LockAI視覺識別模塊:C++目標檢測

    檢測是計算機視覺領域中的一個關鍵任務,它不僅需要識別圖像中存在哪些對象,還需要定位這些對象的位置。具體來說,目標檢測算法會輸出每個檢測到的對象的邊界框(Bounding Box)以及其
    發表于 06-06 14:43

    基于RK3576開發板的車輛檢測算法

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區管理、交通分析等多種場景,是違停識別、堵車識別、車流統計等多種算法
    的頭像 發表于 05-08 17:34 ?853次閱讀
    基于RK3576開發板的車輛<b class='flag-5'>檢測算法</b>

    基于RV1126開發板的車輛檢測算法開發

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區管理、交通分析等多種場景,是違停識別、堵車識別、車流統計等多種算法
    的頭像 發表于 04-14 16:00 ?243次閱讀
    基于RV1126開發板的車輛<b class='flag-5'>檢測算法</b>開發

    軒轅智駕紅外目標檢測算法在汽車領域的應用

    在 AI 技術蓬勃發展的當下,目標檢測算法取得了重大突破,其中紅外目標檢測算法更是在汽車行業掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產業生態。
    的頭像 發表于 03-27 15:55 ?333次閱讀

    睿創微納推出新一代目標檢測算法

    隨著AI技術的發展,目標檢測算法也迎來重大突破。睿創微納作為熱成像領軍者,憑借深厚的技術積累與創新能力,結合AI技術推出新一代目標檢測算法,以三大核心技術帶來AI視覺感知全場景解決方案
    的頭像 發表于 03-20 13:49 ?359次閱讀

    SVPWM的原理及法則推導和控制算法詳解

    ,而且使直流母線電壓的利用率有了很大提高,且更易于實現數字化。下面將對該算法進行詳細分析闡述。 文章過長,請點擊下方可查閱*附件:SVPWM的原理及法則推導和控制算法詳解.pdf
    發表于 03-14 14:51

    如何使用命令將更快的R ACCENT-10.onnx模型轉換為IR?

    /front/onnx/faster_rcnn.json 輸出:[ ERROR ]Exception occurred during running replacer \"
    發表于 03-07 07:43

    執行“mask_rcnn_demo.exe”時,無法找到帶有名稱的Blob:DetectionOutput是怎么回事?

    引用 將 ONNX* Mask R-CNN 模型轉換為 OpenVINO?文檔的中間表示。 已下載并轉換 mask_rcnn_R_50_FPN_1x 模型到 IR 執行命令
    發表于 03-05 07:10

    采用華為云 Flexus 云服務器 X 實例部署 YOLOv3 算法完成目標檢測

    一、前言 1.1 開發需求 這篇文章講解:?采用華為云最新推出的 Flexus 云服務器 X 實例部署 YOLOv3 算法,完成圖像分析、目標檢測。 隨著計算機視覺技術的飛速發展,深度學習模型如
    的頭像 發表于 01-02 12:00 ?476次閱讀
    采用華為云 Flexus 云服務器 X 實例部署 YOLOv3 <b class='flag-5'>算法</b>完成<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>

    目標檢測中大物體的重要性

    ,中等物體提高2個百分點,大物體提高4個百分點)。摘要目標檢測模型是一類重要的機器學習算法,旨在識別并精確定位圖像或視頻中的物體。然而,由于物體的大小差異以及用
    的頭像 發表于 10-09 08:05 ?751次閱讀
    在<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>中大物體的重要性

    目標檢測與識別技術有哪些

    目標檢測與識別技術是計算機視覺領域的重要研究方向,廣泛應用于安全監控、自動駕駛、醫療診斷、工業自動化等領域。 目標檢測與識別技術的基本概念 目標
    的頭像 發表于 07-17 09:40 ?1231次閱讀

    目標檢測與識別技術的關系是什么

    目標檢測與識別技術是計算機視覺領域的兩個重要研究方向,它們之間存在著密切的聯系和相互依賴的關系。 一、目標檢測與識別技術的概念 目標
    的頭像 發表于 07-17 09:38 ?1170次閱讀

    慧視小目標識別算法 解決目標檢測中的老大難問題

    隨著深度學習和人工智能技術的興起與技術成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以在工業界使用的目標檢測算法已逐步成熟并進入實際應用,大多數場景下的目標檢測
    的頭像 發表于 07-17 08:29 ?914次閱讀
    慧視小<b class='flag-5'>目標</b>識別<b class='flag-5'>算法</b>   解決<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>中的老大難問題

    基于深度學習的小目標檢測

    在計算機視覺領域,目標檢測一直是研究的熱點和難點之一。特別是在小目標檢測方面,由于小目標在圖像中所占比例小、特征不明顯,使得
    的頭像 發表于 07-04 17:25 ?1920次閱讀

    人員跌倒識別檢測算法

    人員跌倒識別檢測算法是基于視頻的檢測方法,通過對目標人體監測,當目標人體出現突然倒地行為時,自動監測并觸發報警。人員跌倒識別檢測算法基于計算
    的頭像 發表于 06-30 11:47 ?747次閱讀
    人員跌倒識別<b class='flag-5'>檢測算法</b>
    主站蜘蛛池模板: 久久免费精品高清麻豆 | 天天天天做夜夜夜夜 | 综合婷婷| 女人张开双腿让男人桶完整 | 午夜在线视频网站 | 亚洲丝袜一区二区 | 色综合美国色农夫网 | 天天干天天曰 | 天堂资源8中文最新版在线 天堂资源地址在线 | 四虎影院观看视频 | 在线观看国产精美视频 | 2021天天躁狠狠燥 | 亚洲综合色视频 | 99插插| 色y情视频免费看 | 91大神亚洲影视在线 | 婷婷射 | 亚洲成网站www久久九 | 一级做a爰片久久毛片免费 一级做a爰片久久毛片免费看 | 国产成人精品亚洲77美色 | 1000部又爽又黄的做黄禁片 | 国产色视频一区 | 日本韩国三级视频 | 九月色婷婷| 亚洲三级网 | 天天操人人爱 | 夜夜夜爽bbbb性视频 | 韩日一级毛片 | 欧美天天爽 | 自拍偷拍综合网 | 日本69式xxx视频 | 天天干天天草 | 亚洲一区在线视频观看 | 色中文字幕 | 国产精品美女久久久久网站 | 久久精品亚洲精品国产欧美 | 日韩二级 | 日日射天天射 | 亚洲 欧美 日韩 丝袜 另类 | 伊人成人在线观看 | 国产爽视频 |