在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

FPN(特征金字塔網絡)的直覺、架構和表現簡要介紹

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-08 09:20 ? 次閱讀

編者按:深度學習知名博主Jonathan Hui簡要介紹了FPN(特征金字塔網絡)的直覺、架構和表現。

檢測不同尺度的目標(尤其是其中的小目標)很有挑戰性。我們可以使用同一圖像的不同尺度版本來檢測目標(下圖左部)。然而,處理多尺度圖像很費時,內存需求過高,難以同時進行端到端訓練。因此,我們可能只在推理階段使用這種方法,以盡可能提高精確度,特別是在競賽之類不顧及速度的場景中。我們也可以創建特征金字塔來檢測目標(下圖右部)。然而接近圖像的、由低層結構組成的特征映射在精確目標預測上效果不佳。

來源:FPN論文

特征金字塔網絡(Feature Pyramid Network,FPN)是為這一金字塔概念設計的特征提取器,設計時考慮到了精確性和速度。它代替了Faster R-CNN之類的檢測模型的特征提取器,生成多層特征映射(多尺度特征映射),信息的質量比普通的用于特征檢測的特征金字塔更好。

數據流

來源:FPN論文

FPN由自底向上和自頂向下兩個路徑組成。自底向上的路徑是通常的提取特征的卷積網絡。自底向上,空間分辨率遞減,檢測更多高層結構,網絡層的語義值相應增加。

FPN特征提取(修改自FPN論文中的圖片)

SSD基于多個特征映射進行檢測。然而,低層并不用于目標檢測——這些層的分辨率很高,但語義值不夠高,因此,為了避免顯著的速度下降,目標檢測時不使用這些層。因為SSD檢測時僅適用高層,所以在小目標上的表現要差很多。

修改自FPN論文中的圖片

而FPN提供了自頂向下的路徑,基于語義較豐富的層構建分辨率較高的層。

修改自FPN論文中的圖片

盡管重建的層語義足夠豐富,但經過這些下采樣和上采樣過程,目標的位置不再準確了。因此FPN在重建層和相應的特征映射間增加了橫向連接,以幫助檢測器更好地預測位置。這些橫向連接同時起到了跳躍連接(skip connection)的作用(類似殘差網絡的做法)。

修改自FPN論文中的圖片

自底向上路徑

自底向上路徑由很多卷積模塊組成,每個模塊包含許多卷積層。自底向上的過程中,空間維度逐模塊減半(步長翻倍)。每個卷積模塊的輸出將在自頂向下的路徑中使用。

自頂向下路徑

上圖中,FPN使用一個1x1的卷積過濾器將C5(最上面的卷積模塊)的頻道深度降至256維,得到M5。接著應用一個3x3的卷積得到P5,P5正是用于目標預測的第一個特征映射。

沿著自頂向下的路徑往下,FPN對之前的層應用最近鄰上采樣(x2)。同時,FPN對自底向上通路中的相應特征映射應用1x1卷積。接著應用分素相加。最后同樣應用3x3卷積得到目標檢測的特征映射。這一過濾器減輕了上采樣的混疊效應。

這一過程在P2后停止,因為C1的空間維度太高了。如果不停,依法炮制得到P1的話,會大大拖慢進程。

FPN搭配RPN

FPN自身并不是目標檢測器,而是一個配合目標檢測器使用的特征檢測器。例如,使用FPN提取多層特征映射后將其傳給RPN(基于卷積和錨的目標檢測器)檢測目標。RPN在特征映射上應用3x3卷積,之后在為分類預測和包圍盒回歸分別應用1x1卷積。這些3x3和1x1卷積層稱為RPN頭(head)。其他特征映射應用同樣的RPN頭。

FPN搭配Fast R-CNN和Faster R-CNN

首先簡短地概覽下Fast R-CNN和Faster R-CNN的數據流。它基于特征映射層創建ROI(感興趣區域)。然后使用ROI和特征映射層創建特征片,以傳給ROI池化。

FPN生成了特征映射金字塔后,應用RPN(見上一節)生成ROI。根據ROI的尺寸,選擇最合適的尺度上的特征映射以提取特征片。

基于ROI尺寸選擇特征映射的具體公式為:

其中,w和h為ROI的寬度和高度,k0= 4,k對應FPN中的Pk層。

所以,如果k = 3,我們將選擇P3作為特征映射,應用ROI池化,并將結果傳給Fast R-CNN/Faster R-CNN頭(兩者的頭一致),以完成預測。

分割

類似Mask R-CNN,FPN也是一個優良的圖像分割提取掩碼。下圖中,應用5x5的滑窗于特征映射,以生成14x14分割。之后,合并不同尺度的掩碼以形成最終的掩碼預測。

來源:FPN論文

結果

FPN搭配RPN,提升AR(average recall,平均召回)至56.3,相比RPN基線提升了8. 在小目標上的提升更是達到了12.9.

來源:FPN論文

基于FPN的Faster R-CNN的推理時間為0.148秒/張(單Nvidia M40 GPU,ResNet-50),單尺度ResNet-50基線的速度是0.32秒/張。

來源:FPN論文

FPN和當前最先進的檢測器實力相當。事實上,FPN擊敗了COCO 2016和2015挑戰的贏家。

來源:FPN論文

經驗總結

下面是從試驗數據中總結出的一些經驗。

在單個高分辨率特征映射層上增加更多錨不足以提升精確度。

自頂向下路徑重建了富含語義信息的分辨率。

但我們需要橫向連接,以便將更多準確的目標空間信息加回來。

在COCO數據集上,自頂向下路徑和橫向連接將精確度提升了8。小目標的提升達到了12.9.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    882

    瀏覽量

    48263
  • 圖像
    +關注

    關注

    2

    文章

    1091

    瀏覽量

    40902
  • 數據流
    +關注

    關注

    0

    文章

    122

    瀏覽量

    14635

原文標題:特征金字塔網絡FPN的直覺與架構

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    VirtualLab Fusion案例:反射式金字塔波前傳感器的仿真

    摘要 與傳統的夏克-哈特曼傳感器相比,使用金字塔形棱鏡或反射器的波前傳感器(PyWFS,用于金字塔波前傳感器)具有高對比度和更好的波前靈敏度,例如用于天文學中太陽系外行星的搜索。因此,這種類型的波前
    發表于 01-17 09:51

    VirtualLab 應用:反射式金字塔波前傳感器的仿真

    摘要 與傳統的夏克-哈特曼傳感器相比,使用金字塔形棱鏡或反射器的波前傳感器(PyWFS,用于金字塔波前傳感器)具有高對比度和更好的波前靈敏度,例如用于天文學中太陽系外行星的搜索。因此,這種類型的波前
    發表于 04-26 10:39

    PCB工程師金字塔分級標準

    PCB工程師金字塔分級標準
    發表于 08-06 13:21

    自制for循環打印金字塔

    自制for循環打印金字塔
    發表于 09-18 08:46

    基于金字塔模型的地形網格裂縫消除算法

    本文針對基于多分辨金字塔模型繪制海量地形時的網格裂縫問題,提出了一種網格裂縫消除算法。該算法利用分裂標記表,結合金字塔模型本身分塊與多分辨率的特性,從整體上
    發表于 12-30 12:02 ?8次下載

    繪制金字塔程序實現

    用c語言編程繪制金字塔
    發表于 11-27 16:24 ?888次閱讀

    基于梯度方向直方圖與高斯金字塔的車牌模糊漢字識別方法

    針對現有車牌識別方法中對模糊車牌識別率不高的問題,提出一種結合高斯金字塔與梯度方向直方圖(HOG)特征的車牌識別算法。利用金字塔模型多尺度表達的方法,首先對車牌模糊漢字圖像建立兩層高斯金字塔
    發表于 12-25 10:43 ?0次下載
    基于梯度方向直方圖與高斯<b class='flag-5'>金字塔</b>的車牌模糊漢字識別方法

    一種金字塔注意力網絡,用于處理圖像語義分割問題

    基于以上觀察,我們提出了特征金字塔注意力模塊 (FPA),該模塊能夠融合來自 U 型網絡 (如特征金字塔
    的頭像 發表于 06-05 09:21 ?1.2w次閱讀
    一種<b class='flag-5'>金字塔</b>注意力<b class='flag-5'>網絡</b>,用于處理圖像語義分割問題

    FAIR何愷明團隊最新論文提出“全景FPN”,聚焦于圖像的全景分割任務

    特征金字塔網絡(Feature Pyramid Network):首先簡要回顧一下FPNFPN
    的頭像 發表于 01-11 08:57 ?6379次閱讀

    谷歌大腦采用神經結構搜索發現了一種新的特征金字塔結構NAS-FPN

    的挑戰,即在多種尺度和位置上檢測和定位多個對象。為了解決這一問題,許多先進的目標檢測器通常使用金字塔特征表示,它以多尺度特征層來表示圖像。
    的頭像 發表于 04-21 09:35 ?5274次閱讀
    谷歌大腦采用神經結構搜索發現了一種新的<b class='flag-5'>特征</b><b class='flag-5'>金字塔</b>結構NAS-<b class='flag-5'>FPN</b>

    中國集成電路封裝行業市場現狀——金字塔的尖頂與基座

    中國集成電路封裝行業技術演變路程漫漫集成電路封裝在電子學金字塔中的位置既是金字塔的尖頂又是金字塔的基座。
    的頭像 發表于 07-11 14:51 ?3521次閱讀

    基于全局特征金字塔網絡的信息融合方法

    特征不平衡問題是影響神經網絡檢測效率的關鍵因素。針對 Mask r-CNN中的特征不平衡問題,提出種基于全局特征金字塔
    發表于 03-24 14:51 ?13次下載
    基于全局<b class='flag-5'>特征</b><b class='flag-5'>金字塔</b><b class='flag-5'>網絡</b>的信息融合方法

    基于規范化函數的深度金字塔模型算法

    傳統深度金字塔模型作為一種有效的行人檢測算法備受關注,融合可變形部件模型和卷積神經網絡模型,但特征提取部分使用的算法像素區堿的大小不冋,導致模型之間不能完全融合,在行人數量多、姿勢復雜和有遮擋情況
    發表于 03-30 14:09 ?14次下載
    基于規范化函數的深度<b class='flag-5'>金字塔</b>模型算法

    DIY自制基于51單片機的LED金字塔

    電子發燒友網站提供《DIY自制基于51單片機的LED金字塔.pdf》資料免費下載
    發表于 10-25 10:27 ?0次下載
    DIY自制基于51單片機的LED<b class='flag-5'>金字塔</b>

    談談PCB工程師金字塔分級標準

    印刷電路板(PCB)工程師是電子行業中至關重要的角色,他們的工作直接關系到電子產品的質量和性能。為了明確不同PCB工程師的技能水平和職責范圍,行業內形成了金字塔分級標準。下面將談談這個金字塔的分級標準。
    的頭像 發表于 12-25 10:02 ?659次閱讀
    主站蜘蛛池模板: 久草免费在线播放 | 国产日本特黄特色大片免费视频 | 免费人成网址在线观看国内 | 日本不卡免费高清一级视频 | 色丁香在线 | 亚洲精品蜜桃久久久久久 | 色黄网站成年女人色毛片 | 天天干夜夜添 | 日本成人在线网址 | 一级a爱片久久毛片 | 五月激情啪啪 | 国产免费久久 | 久久午夜国产片 | 亚洲欧美色鬼久久综合 | 日本三级欧美三级香港黄 | 精品伊人久久香线蕉 | 精品福利在线观看 | 欧美影院 | 艹逼视频免费观看 | 女人张开腿让男人做爽爽 | 久久天天躁狠狠躁夜夜躁综合 | 特级全黄一级毛片免费 | 久操视频在线 | 特黄色片 | 亚洲人成人77777网站 | 国产理论视频在线观看 | 99久久综合国产精品免费 | 丁香五月网久久综合 | 美女扒开尿口让男人捅 | 亚洲怡红院在线观看 | 一级毛片在线看在线播放 | 曰本福利写真片视频在线 | 黄色一级毛片在线观看 | 国产在线成人一区二区 | 国产精欧美一区二区三区 | 色婷婷色综合 | 免费在线黄视频 | 狠狠五月婷婷 | 九月婷婷综合婷婷 | 99国产精品农村一级毛片 | 亚洲国产成人久久午夜 |