? 論文鏈接:
https://arxiv.org/abs/2503.05689
?項目鏈接:
https://github.com/YvanYin/GoalFlow
概述
自動駕駛軌跡規劃往往采用直接回歸軌跡的方法,這種方式雖在測試中能取得不錯的性能,可直接輸出當前場景下最有可能的軌跡或控制,但它難以對自動駕駛場景中常見的多模態動作分布進行有效建模。在實際駕駛場景里,往往不存在唯一的最優決策,不同的路況、交通標志以及其他道路使用者的行為等,都可能導致車輛存在多種合理的行駛軌跡選擇,而回歸模型在處理這種多模態特性時顯得力不從心。為了解決這個問題,我們提出了一種基于goal point的生成式方法GoalFlow,通過使用goal point這種強引導信息來引導生成式模型生成安全、高質量、多模態的規劃軌跡。我們的方法在公開數據集Navsim綜合分數大幅領先其他方法。同時,通過Flow Matching對軌跡分布進行建模僅用一步降噪即可實現優秀的推理性能。
GoalFlow解決的問題
當前生成多模態候選軌跡的方法主要由兩種方式:一種是在回歸軌跡的基礎上添加不同的引導信息,例如左右轉等。另一種是通過擴散模型這種連續建模的方式通過不斷加噪和去噪來生成眾多的軌跡。這兩種方式都很難達到理想的效果。前者容易發生軌跡的坍縮,引導出的軌跡非常相似。后者容易生成高度發散的軌跡,這為挑選軌跡增加了難度。為此,GoalFlow主要思考如何探索其他可行道路來實現高質量的候選軌跡生成。
如何應對生成式模型軌跡過于發散的情況
相比生成眾多發散的候選軌跡,從中挑選出來一條最優的作為輸出是更加困難的事情。我們希望通過降低軌跡的發散程度來減輕軌跡打分器的壓力。而其中,使用什么樣的信息來對軌跡進行約束是最重要的。我們發現,相比于dense的圖像或者BEV特征,擴散模型更喜歡sparse的信息。于是,我們采用一段軌跡中最重要的點end point作為goal point來對軌跡進行約束,使得車輛能行駛到goal point。
如何構造goal point
goal point在自動駕駛中并不是個新事物,業務中往往可以使用車道信息來預測goal point或者使用直接將導航作為goal point。但是車道信息往往需要昂貴的高精地圖,而導航往往并不表示車輛在未來幾秒后的精確信息。其他學術上的方法也有map-free的用網格將空間劃分若干單元來進行預測,這種方式又沒有充分考慮到goal point自身的分布特性。在調研眾多方法后,我們根據VADv2的做法,首先將軌跡的末端點進行聚類得到goal point的分布特性后,再從不同角度對goal point進行評估。
如何平衡生成準確軌跡和多模態軌跡
輸入給生成模型的信息包括兩種,一種是goal point來對軌跡進行約束和引導,一種是場景信息的BEV特征。前者對軌跡的要求是生成指向goal point的軌跡,后者是生成當前情況下最有可能的軌跡。為了平衡這兩種需求,我們主要進行了訓練策略上的不同測試。具體來說,我們會對這兩種信息分別進行類型編碼,在訓練過程中采用Classifier-Free Guidance策略,隨機drop掉這兩種特征。訓練時condition輸入包括三類:無condition,場景信息作為condition以及場景信息和goal point作為condition。
GoalFlow框架
核心思路:引入goal point作為引導信息,通過建立dense的goal point詞匯表和新穎評分機制挑選最優goal point,再由goal point和場景信息作為condition,交給Flow Matching生成軌跡。
具體流程:
感知方面上采用transfuser,融合圖像和LiDAR信息,得到BEV feature。
通過聚類數據集中的軌跡末端點得到dense的goal point詞表,作為goal point的候選集。
將goal point和真實end point的遠近程度以及goal point是否在車輛可行駛區域內作為評價標準,從詞表中挑選出當前最優的goal point。
引入flow matching對軌跡進行連續建模,將場景信息和goal point作為condition生成軌跡。
實驗結果
在Navsim數據集上,軌跡采用碰撞率,是否在可行駛區域內,舒適度等綜合指標PDMS來評價。GoalFlow在PDMS上達到90.3分,遠超以regression為代表的Transfuser方法(84.0分)和naive的generative model(85.6分)。模擬真實場景用更精確goal point代替預測goal point時,PDMS達到92.1分,逼近人類駕駛的94.8分。此外,基于flow matching的方法對推理中denoising步數具有魯棒性,只需1步推理就能達到優異性能,大大減輕自動駕駛硬件負擔。
展望與總結
GoalFlow通過聚類方法捕捉目標點 (goal point) 的分布特性,并設計了一套目標點評估機制,為目標點進行打分。基于這些目標點,GoalFlow引導生成式方法Flow Matching生成高質量軌跡。實驗表明,GoalFlow能夠生成優異的軌跡,并提供多樣化的高質量軌跡候選,顯著提升了軌跡生成的性能。
未來,我們將進一步探索如何優化引導信息的利用,尤其是設計更高效的網絡結構,以更好地平衡場景信息和目標點引導信息對模型的影響。此外,當前工作主要聚焦于坐標位置作為引導條件,之后可以進一步探索將人類語言指令作為條件輸入,結合GoalFlow實現更智能的指令跟隨能力,拓展其在人機交互和自動駕駛等領域的應用潛力。
-
模型
+關注
關注
1文章
3427瀏覽量
49514 -
自動駕駛
+關注
關注
788文章
14021瀏覽量
167909
原文標題:CVPR 2025|GoalFlow:目標點驅動,解鎖端到端生成式策略新未來
文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
未來已來,多傳感器融合感知是自動駕駛破局的關鍵
自動駕駛深度多模態目標檢測和語義分割:數據集、方法和挑戰

端到端自動駕駛到底是什么?

基于矢量化場景表征的端到端自動駕駛算法框架

基于端到端的Al自動駕駛決策方法

理想汽車加速自動駕駛布局,成立“端到端”實體組織
Mobileye端到端自動駕駛解決方案的深度解析

評論