大家好!我是蔡彥成https://cademic.html,目前是即將入學的劍橋大學一年級博士生。
我很高興向大家介紹我于復旦大學陳濤老師組完成的第一作者研究工作Rethinking Cross-Domain Pedestrian Detection: A Background-Focused Distribution Alignment Framework for Instance-free One-Stage Detectors,該文章已經(jīng)被頂級期刊IEEE Transactions on Image Processing (T-IP)接收。
文章鏈接:
https://ieeexplore.ieee.org/document/10231122
在CVer公眾號后臺回復:BFDA,可下載本論文pdf
在進行跨域目標檢測和行人檢測任務時,研究人員針對諸如 Faster RCNN 等雙階段檢測器,提出了許多有效的算法框架,例如實例級特征對齊等。然而,從實際應用的角度來看,像 YOLOv5 這樣的單階段檢測器具備更快的處理速度。然而,由于單階段檢測器實例級特征難以獲得,其跨域?qū)R存在前景-背景錯誤對齊問題,即【源域圖像中的前景特征與目標域圖像中的背景特征被錯誤地對齊】或【源域背景與目標域前景被錯誤地對齊】。下圖展示了前景-背景錯誤對齊問題。
Figure 1. 前景-背景特征錯誤對齊問題和背景特征的重要性。
Figure 2. 典型圖像級跨域自適應(第一行)和BFDA(第二行)的特征圖演化過程圖示。
為了解決這一問題,我們系統(tǒng)地分析了前景和背景在圖像級跨域?qū)R中的重要性,并認識到在圖像級跨域?qū)R中,背景起著更為關(guān)鍵的作用。因此,本文提出了一種新穎的框架,即背景聚焦分布對齊(Background-Focused Distribution Alignment,BFDA),來訓練域自適應的單階段行人檢測器。具體來說,BFDA 首先將背景特征與整個圖像特征圖解耦,然后通過一種長短程域判別器將它們進行對齊。
Figure 3. 完整的BFDA框架結(jié)構(gòu),分為四個核心部分:YOLOv5基檢測器,背景解耦模塊(BDM),特征生成模塊(FGM),長短程域判別器(LSD)。
大量實驗表明,與主流領(lǐng)域適應技術(shù)相比,BFDA 顯著增強了單階段和雙階段檢測器的跨域行人檢測性能。此外,通過采用高效的單階段檢測器(YOLOv5),BFDA在NVIDIA Tesla V100上可以達到217.4 FPS(640×480像素)(是現(xiàn)有框架FPS的7~12倍),這對于實際應用具有非常重要的意義。
Figure 4. 在 Cityscapes -> Foggy Cityscapes 和 Cityscapes -> Caltech 兩個實驗設(shè)置下的跨域行人檢測結(jié)果對比,明顯BFDA可以解決傳統(tǒng)圖像級跨域?qū)R方法存在的前景-背景特征錯誤對齊問題。
我們的貢獻總結(jié)如下:
(1)我們的研究揭示了單階段行人檢測器在執(zhí)行圖像級特征對齊時所面臨的前景-背景特征錯誤對齊問題。此外,我們發(fā)現(xiàn)在實現(xiàn)跨域行人檢測時,確保背景特征的域間一致性是至關(guān)重要但未被充分重視的方面。據(jù)我們所知,我們是第一個提出在跨域檢測中專注于背景對齊的研究。
(2)我們提出了一種新的背景聚焦跨域行人檢測框架,包括三個關(guān)鍵模塊:背景解耦模塊(BDM)、特征生成模塊(FGM)和基于并行Transformer-CNN的長短程域鑒別器(LSD)。這一框架通過將背景特征從原始特征圖中解耦,實現(xiàn)了純背景特征對齊,從而有效緩解了前景-背景特征不匹配問題。
(3)我們使用BFDA在跨域行人檢測上進行了實驗,結(jié)果表明所提出的BFDA在單階段檢測器YOLOv5上能夠?qū)崿F(xiàn)最先進的性能。
-
模塊
+關(guān)注
關(guān)注
7文章
2735瀏覽量
47750 -
檢測器
+關(guān)注
關(guān)注
1文章
869瀏覽量
47785 -
框架
+關(guān)注
關(guān)注
0文章
403瀏覽量
17543
原文標題:頂刊TIP 2023!重新思考跨域行人檢測:無實例單階段檢測器的背景聚焦分布對齊框架
文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論