在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解析在目標檢測中怎么解決小目標的問題?

新機器視覺 ? 來源:AI公園 ? 作者:Nabil MADALI ? 2021-04-26 14:13 ? 次閱讀

導讀

本文介紹了一些小目標物體檢測的方法和思路。

深度學習目標檢測中,特別是人臉檢測中,由于分辨率低、圖像模糊、信息少、噪聲多,小目標和小人臉的檢測一直是一個實用和常見的難點問題。然而,在過去幾年的發展中,也出現了一些提高小目標檢測性能的解決方案。本文將對這些方法進行分析、整理和總結。

圖像金字塔和多尺度滑動窗口檢測

一開始,在深學習方法成為流行之前,對于不同尺度的目標,通常是從原始圖像開始,使用不同的分辨率構建圖像金字塔,然后使用分類器對金字塔的每一層進行滑動窗口的目標檢測。

在著名的人臉檢測器MTCNN中,使用圖像金字塔法檢測不同分辨率的人臉目標。然而,這種方法通常是緩慢的,雖然構建圖像金字塔可以使用卷積核分離加速或簡單粗暴地縮放,但仍需要做多個特征提取,后來有人借其想法想出一個特征金字塔網絡FPN,在不同層融合特征,只需要一次正向計算,不需要縮放圖片。它也被應用于小目標檢測,這將在后面的文章中討論。

簡單,粗暴和可靠的數據增強

通過增加訓練集中小目標樣本的種類和數量,也可以提高小目標檢測的性能。有兩種簡單而粗糙的方法:

針對COCO數據集中含有小目標的圖片數量較少的問題,使用過采樣策略:

31941d6e-a648-11eb-aece-12bb97331649.jpg

不同采樣比的實驗。我們觀察到,不管檢測小目標的比率是多少,過采樣都有幫助。這個比例使我們能夠在大小物體之間做出權衡。

針對同一張圖片中小目標數量少的問題,使用分割mask切出小目標圖像,然后使用復制和粘貼方法(當然,再加一些旋轉和縮放)。

通過復制粘貼小目標來實現人工增強的例子。正如我們在這些例子中所觀察到的,粘貼在同一幅圖像上可以獲得正確的小目標的周圍環境。

在Anchor策略方法中,如果同一幅圖中有更多的小目標,則會匹配更多的正樣本。

31b10384-a648-11eb-aece-12bb97331649.jpg

與ground truth物體相匹配的不同尺度anchor示意圖,小的目標匹配到更少的anchor。為了克服這一問題,我們提出通過復制粘貼小目標來人工增強圖像,使訓練過程中有更多的anchor與小目標匹配。

特征融合FPN

不同階段的特征圖對應不同的感受野,其所表達的信息抽象程度也不同。

淺層特征圖感受野小,更適合檢測小目標,深層特征圖較大,更適合檢測大目標。因此,有人提出將不同階段的特征映射整合在一起來提高目標檢測性能,稱之為特征金字塔網絡FPN。

31cc7b5a-a648-11eb-aece-12bb97331649.jpg

(a)利用圖像金字塔建立特征金字塔。特征的計算是在每個圖像的尺度上獨立進行的,這是很緩慢的。(b)最近的檢測系統選擇只使用單一尺度的特征以更快地檢測。另一種選擇是重用由ConvNet計算出的金字塔特征層次結構,就好像它是一個特征圖金字塔。(d)我們提出的特征金字塔網絡(FPN)與(b)和一樣快,但更準確。在這個圖中,特征圖用藍色輪廓線表示,較粗的輪廓線表示語義上較強的特征。

由于可以通過融合不同分辨率的特征圖來提高特征的豐富度和信息含量來檢測不同大小的目標,自然會有人進一步猜測,如果只檢測高分辨率的特征圖(淺層特征)來檢測小人臉,使用中分辨率特征圖(中間特征)來檢測大的臉。

31d8be38-a648-11eb-aece-12bb97331649.jpg

SSH的網絡結構

合適的訓練方法SNIP, SNIPER, SAN

機器學習中有一點很重要,模型預訓練的分布應該盡可能接近測試輸入的分布。因此,在大分辨率(如常見的224 x 224)下訓練的模型不適合檢測小分辨率的圖像,然后放大并輸入到模型中。

如果輸入的是小分辨率的圖像,則在小分辨率的圖像上訓練模型,如果沒有,則應該先用大分辨率的圖片訓練模型,然后再用小分辨率的圖片進行微調,最壞的情況是直接使用大分辨率的圖像來預測小分辨率的圖像(通過上采樣放大)。

因此,在實際應用中,對輸入圖像進行放大并進行高速率的圖像預訓練,然后對小圖像進行微調比針對小目標訓練分類器效果更好。

3202a8ce-a648-11eb-aece-12bb97331649.jpg

所有的圖都報告了ImageNet分類數據集驗證集的準確性。我們對48、64、80等分辨率的圖像進行上采樣,在圖(a)中繪制出預訓練的ResNet-101分類器的Top-1精度。圖(b、c)分別為原始圖像分辨率為48,96像素時不同cnn的結果。

更密集的Anchor采樣和匹配策略S3FD, FaceBoxes

如前面的數據增強部分所述,將一個小目標復制到圖片中的多個位置,可以增加小目標匹配的anchor數量,增加小目標的訓練權重,減少網絡對大目標的偏置。同樣,在逆向思維中,如果數據集已經確定,我們也可以增加負責小目標的anchor的設置策略,使訓練過程中對小目標的學習更加充分。

例如,在FaceBoxes中,其中一個貢獻是anchor策略。

320c45dc-a648-11eb-aece-12bb97331649.jpg

Anchor變的密集例子。為了清晰起見,我們只對一個感受野中心(即中央黑色網格)密集化錨點,并只給對角錨點上色。

Anchor密集化策略,使不同類型的anchor在圖像上具有相同的密度,顯著提高小人臉的召回率。

總結

本文較詳細地總結了一般目標檢測和特殊人臉檢測中常見的小目標檢測解決方案。

英文原文:https://medium.datadriveninvestor.com/how-to-deal-with-small-objects-in-object-detection-44d28d136cbc

來源:AI公園

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 噪聲
    +關注

    關注

    13

    文章

    1137

    瀏覽量

    47891
  • 分辨率
    +關注

    關注

    2

    文章

    1077

    瀏覽量

    42430
  • 人臉檢測
    +關注

    關注

    0

    文章

    86

    瀏覽量

    16769

原文標題:在目標檢測中如何解決小目標的問題?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基于LockAI視覺識別模塊:C++目標檢測

    檢測是計算機視覺領域中的一個關鍵任務,它不僅需要識別圖像存在哪些對象,還需要定位這些對象的位置。具體來說,目標檢測算法會輸出每個檢測到的對
    發表于 06-06 14:43

    基于LockAI視覺識別模塊:C++目標檢測

    本文檔基于瑞芯微RV1106的LockAI凌智視覺識別模塊,通過C++語言做的目標檢測實驗。本文檔展示了如何使用lockzhiner_vision_module::PaddleDet類進行目標
    的頭像 發表于 06-06 13:56 ?27次閱讀
    基于LockAI視覺識別模塊:C++<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>

    labview調用yolo目標檢測、分割、分類、obb

    labview調用yolo目標檢測、分割、分類、obb、pose深度學習,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發表于 03-31 16:28

    軒轅智駕紅外目標檢測算法汽車領域的應用

    AI 技術蓬勃發展的當下,目標檢測算法取得了重大突破,其中紅外目標檢測算法更是汽車行業掀起
    的頭像 發表于 03-27 15:55 ?317次閱讀

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    挑戰的方法。 2 目標檢測模型介紹 目標檢測的任務,有著許許多多的模型,如 Picodet、
    發表于 12-19 14:33

    樹莓派上部署YOLOv5進行動物目標檢測的完整流程

    目標檢測計算機視覺領域中具有重要意義。YOLOv5(You Only Look One-level)是目標檢測算法
    的頭像 發表于 11-11 10:38 ?3317次閱讀
    <b class='flag-5'>在</b>樹莓派上部署YOLOv5進行動物<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>的完整流程

    目標檢測中大物體的重要性

    導讀實驗表明,對大型物體賦予更大的權重可以提高所有尺寸物體的檢測分數,從而整體提升目標檢測器的性能(COCOval2017數據集上使用InternImage-T模型,小物體
    的頭像 發表于 10-09 08:05 ?742次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>目標</b><b class='flag-5'>檢測</b>中大物體的重要性

    智能化升級:機載無人機攝像頭如何自動識別目標

    機載無人機攝像頭智能化升級的過程,自動識別目標的能力得到了顯著提升。這一過程涉及多個關鍵技術和算法,以下是關于機載無人機攝像頭如何自動識別目標的詳細
    的頭像 發表于 09-19 15:23 ?1513次閱讀
    智能化升級:機載無人機攝像頭如何自動識別<b class='flag-5'>目標</b>?

    圖像分割與目標檢測的區別是什么

    的區別。 定義 圖像分割是將圖像劃分為若干個區域或對象的過程,這些區域或對象具有相似的屬性,如顏色、紋理或形狀。圖像分割的目的是將圖像的不同對象或區域分離出來,以便進行進一步的分析和處理。 目標檢測則是
    的頭像 發表于 07-17 09:53 ?2211次閱讀

    目標檢測與圖像識別的區別在哪

    檢測(Object Detection)是指在圖像或視頻識別并定位感興趣的目標,通常包括目標的類別和位置。目標
    的頭像 發表于 07-17 09:51 ?1623次閱讀

    目標檢測與識別技術有哪些

    視頻識別并定位感興趣的目標,通常包括目標的類別和位置信息。目標識別(Object Recognition)是指對檢測到的
    的頭像 發表于 07-17 09:40 ?1202次閱讀

    目標檢測與識別技術的關系是什么

    任務是圖像或視頻快速準確地定位出感興趣的目標,并給出目標的位置信息。目標檢測技術通常包括候選
    的頭像 發表于 07-17 09:38 ?1137次閱讀

    目標檢測識別主要應用于哪些方面

    介紹目標檢測識別的應用領域,以及其各個領域的具體應用情況。 安全監控 安全監控是目標檢測識別應用最廣泛的領域之一。
    的頭像 發表于 07-17 09:34 ?1748次閱讀

    慧視小目標識別算法 解決目標檢測的老大難問題

    隨著深度學習和人工智能技術的興起與技術成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以工業界使用的目標檢測算法已逐步成熟并進入實際應用,大多數場景下的目標
    的頭像 發表于 07-17 08:29 ?890次閱讀
    慧視小<b class='flag-5'>目標</b>識別算法   解決<b class='flag-5'>目標</b><b class='flag-5'>檢測</b><b class='flag-5'>中</b>的老大難問題

    基于深度學習的小目標檢測

    計算機視覺領域,目標檢測一直是研究的熱點和難點之一。特別是目標檢測方面,由于小
    的頭像 發表于 07-04 17:25 ?1896次閱讀
    主站蜘蛛池模板: 视频一区二区在线 | 日本精品高清一区二区2021 | 一级做a爰片久久毛片美女图片 | www.人人干| 色综合天天综合网国产成人 | 欧美精品影院 | 久草色在线 | 在线午夜影院 | 亚洲人成亚洲人成在线观看 | 在线观看二区三区午夜 | 女人十六毛片 | 亚洲成a人片7777 | 国产精品嫩草影院在线播放 | 午夜精品视频在线观看 | 国产午夜视频高清 | 丁香婷婷亚洲六月综合色 | 亚洲伊人精品综合在合线 | 永久免费视频网站在线观看 | 中文字幕天堂 | 亚洲狠狠婷婷综合久久久久图片 | 97天天摸天天碰天天爽 | 久久亚洲aⅴ精品网站婷婷 久久亚洲成人 | 老师在办公室被躁得舒服小说 | 天天操天天干天天透 | 日韩性插| 欧美一级二级三级视频 | 免费观看成人欧美1314www | 国产情侣真实露脸在线最新 | 57pao强力打造免费高清高速 | 国内免费视频成人精品 | 久久男人的天堂色偷偷 | 你懂得在线播放 | 特级片免费看 | 欧美一级做一a做片性视频 欧美一级做一级做片性十三 | 色优久久| 日日干夜夜欢 | 久久网综合 | 一区二区三区免费在线 | 国产yw.8825.c免费 | 久久精品第一页 | 五月婷婷丁香六月 |