說到純視覺的自動駕駛方案,大家第一個想到的就是Tesla吧。的確,早在2021年,Tesla就已經實現了純視覺的BEV檢測方案,而且效果非常好。
細心的同學可能發現了,這套BEV方案中將相機空間的圖像轉換到BEV空間的核心組件就是Transformer。
Transformer來源于自然語言處理領域,首先被應用于機器翻譯。后來,大家發現它在計算機視覺領域效果也很不錯,而且在各大排行榜上碾壓CNN網絡。
目標檢測領域中,視覺Transformer不僅可以實現2D檢測、3D檢測,還可以實現多模態檢測,BEV視角下的檢測,性能也非常出色。
因此,掌握Transformer相關知識和工程基礎成為了企業招聘算法工程師的一個技能要求點,也是簡歷上的一個很大的加分項。
然而,想要掌握基于Transformer的目標檢測算法,有以下3個難點:
理解Transformer背后的理論基礎,比如自注意力機制(self-attention), 位置編碼(positional embedding),目標查詢(object query)等等,網上的資料比較雜亂,不夠系統,難以通過自學做到深入理解并融會貫通。
掌握基于Transformer的目標檢測算法的思路和創新點,一些Transformer論文涉及的新概念比較多,話術沒有那么通俗易懂,讀完論文仍然不理解算法的細節部分。
2
Transformer代碼不易看懂,因為作用機制與CNN有不少差別,所以完全理解代碼并實踐應用需要花費很大功夫。
3
那么如何學習基于Tansformer的目標檢測算法呢?
3D視覺工坊聯合講師「語嫣」,為大家精心準備了課程「目標檢測中的視覺Transformer」,主要幫助各位同學解決以上這些難點。
不僅為大家詳細講解視覺Transformer的基礎知識,各種經典的基于Transformer的目標檢測算法,還配有代碼解讀和實踐課程,讓大家真正活學活用,理解和掌握這些知識理論。
實踐部分
-
機器翻譯
+關注
關注
0文章
139瀏覽量
14953 -
Transformer
+關注
關注
0文章
146瀏覽量
6056 -
自然語言處理
+關注
關注
1文章
620瀏覽量
13655
原文標題:視覺Transformer,火了
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
基于深度學習的目標檢測算法解析
PowerPC小目標檢測算法怎么實現?
基于YOLOX目標檢測算法的改進
基于像素分類的運動目標檢測算法
淺談紅外弱小目標檢測算法
無Anchor的目標檢測算法邊框回歸策略
![無Anchor的<b class='flag-5'>目標</b><b class='flag-5'>檢測算法</b>邊框回歸策略](https://file1.elecfans.com/web2/M00/8C/E2/wKgZomS0srSAIyQMAAAMrg-lD5s923.jpg)
基于Transformer的目標檢測算法的3個難點
![基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目標</b><b class='flag-5'>檢測算法</b>的<b class='flag-5'>3</b><b class='flag-5'>個</b><b class='flag-5'>難點</b>](https://file1.elecfans.com/web2/M00/8D/02/wKgZomS2G6CAOk0RAABCQYt4u1M168.png)
基于強化學習的目標檢測算法案例
基于Transformer的目標檢測算法
![基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目標</b><b class='flag-5'>檢測算法</b>](https://file1.elecfans.com/web2/M00/90/AB/wKgZomTcOjWAOmr4AAA5eUWRJ3E280.png)
基于Transformer的目標檢測算法難點
![基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目標</b><b class='flag-5'>檢測算法難點</b>](https://file1.elecfans.com/web2/M00/95/3C/wKgaomTmzL6AABM6AAA5eUWRJ3E880.png)
評論