[首發(fā)于智駕最前沿微信公眾號]隨著汽車行業(yè)智能化浪潮的不斷推進(jìn),智能駕駛技術(shù)正在從L2級輔助駕駛向L3及以上的高階自動駕駛演進(jìn)。特別是端到端智能駕駛技術(shù)的出現(xiàn),標(biāo)志著行業(yè)正在邁向一個全新的階段。與傳統(tǒng)的模塊化設(shè)計不同,端到端技術(shù)以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),將感知、決策、控制等功能整合為一個整體架構(gòu),從根本上簡化了系統(tǒng)復(fù)雜性,提高了效率和泛化能力。這種技術(shù)突破不僅改變了智能駕駛技術(shù)的開發(fā)模式,也對行業(yè)格局產(chǎn)生了深遠(yuǎn)影響。
近年來,端到端技術(shù)的逐步落地得益于多方面的推動因素。一方面,汽車電子電氣架構(gòu)的升級、車載高算力芯片的普及,以及深度學(xué)習(xí)算法的演進(jìn),為端到端技術(shù)的實(shí)現(xiàn)提供了堅實(shí)的技術(shù)基礎(chǔ)。另一方面,政策和法規(guī)的逐步松綁,以及消費(fèi)者對高階智駕功能需求的日益增長,也加速了端到端技術(shù)的商業(yè)化進(jìn)程。
更重要的是,端到端技術(shù)的成功落地重塑了高階智能駕駛的核心競爭邏輯。在傳統(tǒng)的智能駕駛開發(fā)中,算法設(shè)計占據(jù)主導(dǎo)地位,而在端到端技術(shù)時代,數(shù)據(jù)和算力成為決定成敗的關(guān)鍵因素。企業(yè)需要在海量數(shù)據(jù)的采集和高效訓(xùn)練算力的分配上下更大功夫,這不僅對研發(fā)資源提出了更高的要求,也促使更多車企傾向于采用全棧自研模式,以實(shí)現(xiàn)數(shù)據(jù)閉環(huán)和快速迭代。
端到端技術(shù),智能駕駛的新動力
端到端技術(shù)正在重新定義智能駕駛系統(tǒng)的開發(fā)模式,其核心在于以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),通過數(shù)據(jù)驅(qū)動的方式實(shí)現(xiàn)從感知到控制的全流程整合。這一技術(shù)摒棄了傳統(tǒng)模塊化設(shè)計,將感知、規(guī)劃和控制的各環(huán)節(jié)融為一體,使得系統(tǒng)具備更高的效率、更強(qiáng)的泛化能力以及更優(yōu)的全局優(yōu)化效果。傳統(tǒng)的模塊化智能駕駛系統(tǒng)將感知、決策、規(guī)劃和控制分為獨(dú)立模塊,各模塊之間通過預(yù)設(shè)接口進(jìn)行信息傳遞。然而,這種方式不可避免地帶來了信息傳遞中的延遲、冗余以及錯誤累積等問題,導(dǎo)致整體性能上限受限。傳統(tǒng)系統(tǒng)對規(guī)則的高度依賴使得其泛化能力較弱,在面對未見過的場景時難以做出準(zhǔn)確的判斷。而端到端技術(shù)通過直接映射輸入(如傳感器數(shù)據(jù))和輸出(如方向盤角度或油門剎車信號),省去了中間復(fù)雜的分模塊設(shè)計,從根本上簡化了系統(tǒng)架構(gòu)并提升了性能。
傳統(tǒng)智能駕駛系統(tǒng)構(gòu)成
端到端架構(gòu)依賴于先進(jìn)的深度學(xué)習(xí)方法,通過大規(guī)模神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)進(jìn)行處理。以特斯拉為例,其FSD V12系統(tǒng)采用了BEV(鳥瞰視角)和Transformer模型,將多攝像頭采集的二維圖像數(shù)據(jù)統(tǒng)一映射到三維空間坐標(biāo)系中,實(shí)現(xiàn)了全局感知的增強(qiáng)。通過Transformer的多層特征交互機(jī)制,該系統(tǒng)能夠更高效地從數(shù)據(jù)中提取關(guān)鍵信息,顯著提升了感知的精度和對動態(tài)場景的理解能力。這種全局優(yōu)化能力的提升,使得端到端技術(shù)能夠減少傳統(tǒng)模塊化系統(tǒng)中因模塊分離而導(dǎo)致的延遲和信息損耗問題。此外,端到端技術(shù)在訓(xùn)練過程中利用海量駕駛數(shù)據(jù),通過深度學(xué)習(xí)模型直接優(yōu)化整體駕駛性能,使系統(tǒng)對未知場景的泛化能力顯著提高。這種泛化能力使得端到端模型可以應(yīng)對復(fù)雜多變的道路環(huán)境,包括如異常的交通標(biāo)志、非規(guī)則道路或復(fù)雜天氣條件等各種“長尾場景”(corner cases)。
更重要的是,端到端技術(shù)在計算效率上的優(yōu)勢也為其快速推廣提供了技術(shù)保障。傳統(tǒng)模塊化系統(tǒng)需要在每個模塊中單獨(dú)處理數(shù)據(jù),信息在不同模塊間傳遞時容易產(chǎn)生冗余,而端到端架構(gòu)通過一體化的神經(jīng)網(wǎng)絡(luò)直接完成從輸入到輸出的映射,大幅提升了處理效率。端到端模型的結(jié)構(gòu)使得其能夠更高效地利用計算資源,顯著降低系統(tǒng)運(yùn)行的算力需求,從而進(jìn)一步推動高階智能駕駛功能的規(guī)模化落地。
端到端技術(shù)的另一個關(guān)鍵特點(diǎn)是其高度依賴數(shù)據(jù)驅(qū)動的開發(fā)模式。相比傳統(tǒng)系統(tǒng)需要人為設(shè)計規(guī)則,端到端技術(shù)完全依賴于大量真實(shí)駕駛數(shù)據(jù)的訓(xùn)練。這種方法不僅提升了系統(tǒng)性能,還通過不斷迭代優(yōu)化,使得端到端模型可以快速適配不同場景和需求。理想汽車在其4D One Model架構(gòu)中,通過將全國范圍內(nèi)的用戶駕駛數(shù)據(jù)用于模型訓(xùn)練,顯著提升了系統(tǒng)在城市復(fù)雜場景中的表現(xiàn)。特斯拉通過其龐大的數(shù)據(jù)采集網(wǎng)絡(luò),在全球范圍內(nèi)積累了超過20億英里的輔助駕駛里程數(shù)據(jù),使其FSD系統(tǒng)能夠?qū)崿F(xiàn)對不同駕駛場景的高效適配和優(yōu)化。這種數(shù)據(jù)驅(qū)動的開發(fā)模式結(jié)合端到端架構(gòu)的全局優(yōu)化能力,使得智能駕駛系統(tǒng)能夠在性能和可靠性上實(shí)現(xiàn)質(zhì)的飛躍。
端到端技術(shù)憑借其整體優(yōu)化、數(shù)據(jù)驅(qū)動和高效計算的特點(diǎn),正在成為推動智能駕駛技術(shù)發(fā)展的核心動力。其對傳統(tǒng)智能駕駛架構(gòu)的顛覆性革新,不僅解決了模塊化系統(tǒng)的瓶頸,還為實(shí)現(xiàn)更高階的智能駕駛功能提供了技術(shù)基礎(chǔ)。隨著深度學(xué)習(xí)算法和硬件算力的持續(xù)進(jìn)步,端到端技術(shù)有望在未來進(jìn)一步釋放潛力,為汽車行業(yè)帶來更多可能性。
基于端到端模型的智能駕駛系統(tǒng)
端到端技術(shù)的落地,城市NOA的突破
端到端技術(shù)的快速發(fā)展,使得城市NOA(Navigate on Autopilot)成為高階智能駕駛落地的標(biāo)志性場景。城市NOA是一種復(fù)雜場景下的高階駕駛輔助功能,能夠在城市道路環(huán)境中完成車道保持、無保護(hù)左轉(zhuǎn)、無保護(hù)掉頭、交通信號燈識別、自動變道超車等操作。這些功能對技術(shù)的要求極為苛刻,既需要對復(fù)雜道路環(huán)境的精準(zhǔn)感知,也需要快速、高效的規(guī)劃與決策能力。傳統(tǒng)模塊化智能駕駛系統(tǒng)在實(shí)現(xiàn)城市NOA時,由于模塊間的信息損耗和局限性,難以滿足高復(fù)雜場景的實(shí)時性與穩(wěn)定性要求。而端到端技術(shù)的引入,通過整體優(yōu)化的方式,為城市NOA的突破提供了強(qiáng)有力的技術(shù)支撐。
在技術(shù)實(shí)現(xiàn)層面,城市NOA依賴于端到端神經(jīng)網(wǎng)絡(luò)的全局感知與決策能力。這種系統(tǒng)通過多模態(tài)數(shù)據(jù)融合(如攝像頭、毫米波雷達(dá)、激光雷達(dá)和超聲波傳感器),實(shí)時生成鳥瞰視角(BEV)特征圖,將車輛周圍的環(huán)境信息完整呈現(xiàn)到統(tǒng)一坐標(biāo)系中。在BEV的基礎(chǔ)上,系統(tǒng)引入Transformer模型,將二維圖像特征與三維空間信息融合,使其能夠高效處理動態(tài)和靜態(tài)目標(biāo)之間的交互關(guān)系。這種全局感知能力為城市復(fù)雜場景中的障礙物檢測、動態(tài)目標(biāo)追蹤以及靜態(tài)目標(biāo)預(yù)測提供了技術(shù)保障。小鵬汽車在其XNGP系統(tǒng)中,通過端到端BEV+Transformer架構(gòu),實(shí)現(xiàn)了對道路邊界、不規(guī)則車道線、交通信號燈和行人的精準(zhǔn)識別,從而支持城區(qū)NOA的全國范圍開通。
除了感知能力的提升,端到端技術(shù)對規(guī)劃和決策模塊的優(yōu)化也至關(guān)重要。傳統(tǒng)模塊化系統(tǒng)中,感知、規(guī)劃與控制各自獨(dú)立運(yùn)行,規(guī)劃模塊在接收到感知信息后再進(jìn)行路徑?jīng)Q策,這種設(shè)計不可避免地會帶來延遲。而端到端技術(shù)通過一體化的神經(jīng)網(wǎng)絡(luò)架構(gòu),直接從傳感器輸入生成控制指令,避免了模塊間的信息重復(fù)傳遞和延遲問題,大幅提升了系統(tǒng)的響應(yīng)速度和決策效率。理想汽車在其4D One Model架構(gòu)中采用的端到端模型能夠在毫秒級內(nèi)完成從感知到控制的整個流程,使車輛在面對城市復(fù)雜交通場景時能夠快速調(diào)整行駛策略。
端到端技術(shù)在城市NOA中的應(yīng)用還體現(xiàn)在對場景泛化能力的提升上。城市道路環(huán)境因區(qū)域、天氣、交通規(guī)則等因素的差異而極為復(fù)雜,傳統(tǒng)規(guī)則驅(qū)動的智能駕駛系統(tǒng)難以全面覆蓋所有“長尾場景”。端到端技術(shù)通過基于海量數(shù)據(jù)的深度學(xué)習(xí),顯著增強(qiáng)了對未見過場景的適應(yīng)能力。特斯拉的FSD系統(tǒng)通過引入Occupancy網(wǎng)絡(luò)技術(shù),利用三維空間建模對道路環(huán)境中的異形障礙物進(jìn)行預(yù)測,使其在面對突發(fā)場景時依然能夠保持高效、安全的駕駛表現(xiàn)。此外,理想和小鵬等廠商在端到端技術(shù)中加入了更高級的視覺語言模型(VLM),實(shí)現(xiàn)了更擬人化的決策行為,進(jìn)一步提高了用戶體驗(yàn)和駕駛安全性。
從成本角度來看,端到端技術(shù)在硬件資源利用方面的優(yōu)化也助推了城市NOA的落地。以往模塊化系統(tǒng)需要依賴多個高性能處理器分別完成感知、決策和控制任務(wù),而端到端技術(shù)通過整體模型的高效運(yùn)行,顯著降低了算力需求。例如,在城市NOA功能的開發(fā)中,特斯拉、理想和小鵬均通過優(yōu)化端到端模型的架構(gòu),減少了系統(tǒng)運(yùn)行所需的硬件成本,從而推動了高階智駕功能在更廣泛價位車型中的普及。這種硬件與軟件的協(xié)同優(yōu)化不僅降低了開發(fā)與生產(chǎn)成本,也使得城市NOA的滲透率得以快速提升。
審核編輯 黃宇
-
端到端
+關(guān)注
關(guān)注
0文章
34瀏覽量
10685 -
自動駕駛
+關(guān)注
關(guān)注
788文章
14247瀏覽量
169975
發(fā)布評論請先 登錄
一文帶你厘清自動駕駛端到端架構(gòu)差異

自動駕駛中基于規(guī)則的決策和端到端大模型有何區(qū)別?

東風(fēng)汽車推出端到端自動駕駛開源數(shù)據(jù)集
技術(shù)分享 |多模態(tài)自動駕駛混合渲染HRMAD:將NeRF和3DGS進(jìn)行感知驗(yàn)證和端到端AD測試

動量感知規(guī)劃的端到端自動駕駛框架MomAD解析

DiffusionDrive首次在端到端自動駕駛中引入擴(kuò)散模型

端到端自動駕駛技術(shù)研究與分析
端到端在自動泊車的應(yīng)用

從車企實(shí)踐看自動駕駛端到端解決方案

連接視覺語言大模型與端到端自動駕駛

Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)
Mobileye端到端自動駕駛解決方案的深度解析

評論