最新消息,阿里達(dá)摩院又有新的研究進(jìn)展,這次在自動駕駛3D物體檢測領(lǐng)域。
達(dá)摩院的研究人員提出一個通用、高性能的檢測器,在自動駕駛領(lǐng)域權(quán)威數(shù)據(jù)集KITTI BEV(鳥瞰)上,檢測速度達(dá)到25FPS ,一舉占據(jù)榜首,與排名第二的方案相比,減少了一半多,同時精度也遠(yuǎn)超其他的單階段檢測器??梢哉f首次實現(xiàn)3D物體檢測精度與速度兼得。
達(dá)摩院研究團(tuán)隊表示:“檢測器是自動駕駛系統(tǒng)的核心組件之一,但該領(lǐng)域一直缺少創(chuàng)新和突破,此次我們實現(xiàn)3D檢測精度和速度的提升,將有助于提高自動駕駛系統(tǒng)的安全性。”
從實驗結(jié)果來看,他們顯然取得了良好進(jìn)展,而且研究的主要完成人員(一作),還是達(dá)摩院的實習(xí)生。
同時,該研究也得到了同行們的認(rèn)可,被計算機(jī)視覺領(lǐng)域頂級會議CVPR 2020收錄。他們是如何做到的呢?我們借助阿里達(dá)摩院提供的解讀,一一來看。
如何實現(xiàn)精度和速度兼得?
眾所周知,與普通2D圖像識別應(yīng)用不同,自動駕駛系統(tǒng)對精度和速度的要求更高,不僅需要快速識別周圍環(huán)境的物體,還要對物體在三維空間中的位置做精準(zhǔn)定位。
僅靠傳感器和算法模型,通常無法平衡視覺識別的精度和速度。因此,檢測器成為提升自動駕駛系統(tǒng)安全性的一個關(guān)鍵因素。
經(jīng)過多年研究,當(dāng)前業(yè)界主流的單階段檢測器在檢測速度上很好,但在檢測精度卻差強(qiáng)人意。
這就是達(dá)摩院研究的出發(fā)點:尋找一種能二者兼得的方法。
他們提出的思路是:將兩階段檢測器中對特征進(jìn)行細(xì)粒度刻畫的思想,移植到單階段檢測中。
在他們的模型中,用于部署的檢測器, 即推斷網(wǎng)絡(luò), 由一個骨干網(wǎng)絡(luò)和檢測頭組成。
骨干網(wǎng)絡(luò)用3D的稀疏網(wǎng)絡(luò)實現(xiàn),用于提取含有高語義的體素特征。檢測頭將體素特征壓縮成鳥瞰圖表示,并在上面運(yùn)行2D全卷積網(wǎng)絡(luò)來預(yù)測3D物體框。
他們在訓(xùn)練中利用一個輔助網(wǎng)絡(luò)將單階段檢測器中的體素特征,轉(zhuǎn)化為點級特征并施加一定的監(jiān)督信號。
在實現(xiàn)上,他們將卷積特征中的非零信號映射到原始的點云空間中, 然后在每個點上進(jìn)行插值,來獲取卷積特征的點級表示。使得卷積特征也具有結(jié)構(gòu)感知能力,來提高檢測精度。
而在做模型推斷時,輔助網(wǎng)絡(luò)并不參與計算(detached),保證單階段檢測器的檢測效率。
另外,他們還提出一個工程上的改進(jìn):Part-sensitive Warping (PSWarp),用于處理單階段檢測器中存在的 “框-置信度-不匹配” 問題。
核心思路是:利用采樣器, 用生成的采樣網(wǎng)格在對應(yīng)的局部敏感特征圖上進(jìn)行采樣,生成對齊好的特征圖。最終能反映置信度的特征圖,是K個對齊好特征圖的平均。
單階段方法,能達(dá)到兩階段方法精度
阿里達(dá)摩院的研究人員,在KITTI數(shù)據(jù)集上評估了方法的有效性。下圖(PR Curve)中,實線為兩階段方法, 虛線為單階段方法。
可以看出,達(dá)摩院提出的單階段方法(黑色)能夠達(dá)到兩階段方法才能達(dá)到的精度。
下圖展示了他們在KITTI 鳥瞰(BEV) 和 3D 測試集上的結(jié)果。
可以看出,他們提出的方法,可以在不增加額外計算量的情況下,達(dá)到25FPS 的檢測速度,而且還能保持精度。具體的檢測效果如下:
兩位共同一作,都是達(dá)摩院研究實習(xí)生
研究論文,標(biāo)題為“Structure Aware Single-Stage 3D Object Detection from Point Cloud”,共有5名研究人員參與,分別來自阿里達(dá)摩院和香港理工大學(xué)。
第一作者是Chenhang He,是阿里達(dá)摩院的研究實習(xí)生,正在香港理工大學(xué)讀博,預(yù)計2022年畢業(yè)。
他的導(dǎo)師是達(dá)摩院高級研究員、香港理工大學(xué)電子計算學(xué)系講座教授、IEEE Fellow張磊,也是這一研究的通訊作者。
另一位第一作者Hui Zeng,也是是阿里達(dá)摩院的研究實習(xí)生,同樣是張磊的博士生,預(yù)計在今年畢業(yè)。
其他作者,分別是達(dá)摩院高級研究員、IEEE Fellow華先勝、達(dá)摩院資深算法專家黃建強(qiáng)等。
-
計算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1701瀏覽量
46180 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1211瀏覽量
24890 -
自動駕駛
+關(guān)注
關(guān)注
785文章
13961瀏覽量
167292
原文標(biāo)題:阿里達(dá)摩院新研究:實習(xí)生一作突破自動駕駛技術(shù)難題,首次實現(xiàn)3D物體檢測精度與速度兼得
文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】2.具身智能機(jī)器人的基礎(chǔ)模塊
淺析基于自動駕駛的4D-bev標(biāo)注技術(shù)
![淺析基于<b class='flag-5'>自動駕駛</b>的4<b class='flag-5'>D</b>-bev標(biāo)注技術(shù)](https://file1.elecfans.com/web3/M00/01/59/wKgZO2dSoE6AFL3eAACJGpw83rQ068.png)
使用STT全面提升自動駕駛中的多目標(biāo)跟蹤
![使用STT全面提升<b class='flag-5'>自動駕駛</b>中的多目標(biāo)跟蹤](https://file1.elecfans.com/web1/M00/F3/C9/wKgaoWce8qWAFGkrAAAvAz45dB8054.png)
AI大模型的最新研究進(jìn)展
![](https://file1.elecfans.com/web2/M00/09/90/wKgZomcPKxmASQCFAAEgUWmACmg080.jpg)
自動駕駛技術(shù)進(jìn)展及其對未來出行的影響
阿里達(dá)摩院發(fā)布玄鐵R908 CPU
FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?
FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?
小馬智行再獲自動駕駛卡車編隊測試許可
三星停止自動駕駛研究,開發(fā)人員轉(zhuǎn)到機(jī)器人領(lǐng)域
阿里達(dá)摩院提出“知識鏈”框架,降低大模型幻覺
未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵
阿里達(dá)摩院北京公司新增AI業(yè)務(wù)
基于深度學(xué)習(xí)的方法在處理3D點云進(jìn)行缺陷分類應(yīng)用
![基于深度學(xué)習(xí)的方法<b class='flag-5'>在</b>處理<b class='flag-5'>3D</b>點云進(jìn)行缺陷分類應(yīng)用](https://file1.elecfans.com/web2/M00/C1/8C/wKgaomXXA2-AMIIzAABLUY5BmWY274.png)
評論