在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自動駕駛中常提的VLA是個啥?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-06-18 09:20 ? 次閱讀

[首發于智駕最前沿微信公眾號]隨著自動駕駛技術落地,很多新技術或在其他領域被使用的技術也在自動駕駛行業中得到了實踐,VLA就是其中一項,尤其是隨著端到端大模型的提出,VLA在自動駕駛中的使用更加普遍。那VLA到底是個啥?它對于自動駕駛行業來說有何作用?

VLA全稱為“Vision-Language-Action”,即視覺-語言-動作模型,其核心思想是將視覺感知、語言理解與動作決策端到端融合,在一個統一的大模型中完成從環境觀察到控制指令輸出的全過程。與傳統自動駕駛系統中感知、規劃、控制模塊化分工的思路不同,VLA模型通過大規模數據驅動,實現了“圖像輸入、指令輸出”的閉環映射,有望大幅提高系統的泛化能力與場景適應性。

wKgZPGhSFGGADiWsAABhun9Lczk192.jpg

VLA最早由GoogleDeepMind于2023年在機器人領域提出,旨在解決“視覺-語言-動作”三者協同的智能體控制問題。DeepMind的首個VLA模型通過將視覺編碼器與語言編碼器與動作解碼器結合,實現了從攝像頭圖像和文本指令到物理動作的直接映射。這一技術不僅在機器人操作上取得了突破,也為智能駕駛場景引入了全新的端到端思路。

在自動駕駛領域,感知技術通常由雷達、激光雷達、攝像頭等多種傳感器負責感知,感知結果經過目標檢測、語義分割、軌跡預測、行為規劃等一系列模塊處理,最后由控制器下發方向盤和油門等動作指令。整個流程雖條理清晰,卻存在模塊間誤差累積、規則設計復雜且難以覆蓋所有極端場景的短板。VLA模型正是在此背景下應運而生,它舍棄了中間的手工設計算法,直接用統一的神經網絡從多模態輸入中學習最優控制策略,從而簡化了系統架構,提高了數據利用效率。

wKgZO2hSFGKAL_qDAACtwrr_t_Y075.jpg

VLA模型通常由四個關鍵模塊構成。第一是視覺編碼器,用于對攝像頭或激光雷達等傳感器采集的圖像和點云數據進行特征提取;第二是語言編碼器,通過大規模預訓練的語言模型,理解導航指令、交通規則或高層策略;第三是跨模態融合層,將視覺和語言特征進行對齊和融合,構建統一的環境理解;第四是動作解碼器或策略模塊,基于融合后的多模態表示生成具體的控制指令,如轉向角度、加減速命令等。

在視覺編碼器部分,VLA模型一般采用卷積神經網絡或視覺大模型(VisionTransformer)對原始像素進行深度特征抽取;同時,為了增強對三維場景的理解,部分研究引入三維空間編碼器,將多視角圖像或點云映射到統一的三維特征空間中。這些技術使VLA在處理復雜道路環境、行人辨識和物體追蹤上擁有較傳統方法更強的表現力。

語言編碼器則是VLA與傳統端到端駕駛模型的最大差異所在。通過接入大規模預訓練語言模型,VLA能夠理解自然語言形式的導航指令(如“前方在第二個紅綠燈右轉”)或高層安全策略(如“當檢測到行人時務必減速至5公里/小時以下”),并將這些理解融入決策過程。這種跨模態理解能力不僅提升了系統的靈活性,也為人車交互提供了新的可能。

跨模態融合層在VLA中承擔著“粘合劑”作用,它需要設計高效的對齊算法,使視覺與語言特征在同一語義空間內進行交互。一些方案利用自注意力機制(Self-Attention)實現特征間的深度融合,另一些方案則結合圖神經網絡或Transformer結構進行多模態對齊。這些方法的目標都是構建一個統一表征,以支持后續更準確的動作生成。

動作解碼器或策略模塊通常基于強化學習或監督學習框架訓練。VLA利用融合后的多模態特征,直接預測如轉向角度、加速度和制動壓力等連續控制信號。這一過程省去了傳統方案中復雜的規則引擎和多階段優化,使整個系統在端到端訓練中獲得了更優的全局性能。但同時也帶來了可解釋性不足、安全驗證難度增大等挑戰。

VLA模型的最大優勢在于其強大的場景泛化能力與上下文推理能力。由于模型在大規模真實或仿真數據上學習了豐富的多模態關聯,它能在復雜交叉路口、弱光環境或突發障礙物出現時,更迅速地做出合理決策。此外,融入語言理解后,VLA可以根據指令靈活調整駕駛策略,實現更自然的人機協同駕駛體驗。

國內外多家企業已開始將VLA思想應用于智能駕駛研發。DeepMind的RT-2模型在機器人控制上展示了端到端視覺-語言-動作融合的潛力,而元戎啟行公開提出的VLA模型,被其定義為“端到端2.0版本”,元戎啟行CEO周光表示“這套系統上來以后城區智駕才能真正達到好用的狀態”。智平方在機器人領域推出的GOVLA模型,也展示了全身協同與長程推理的先進能力,為未來智能駕駛提供了新的參考。

VLA雖然給自動駕駛行業提出了新的可能,但實際應用依舊面臨很多挑戰。首先是模型可解釋性不足,作為“黑盒子”系統,很難逐步排查在邊緣場景下的決策失誤,給安全驗證帶來難度。其次,端到端訓練對數據質量和數量要求極高,還需構建覆蓋多種交通場景的高保真仿真環境。另外,計算資源消耗大、實時性優化難度高,也是VLA商用化必須克服的技術壁壘。

為了解決上述問題,也正在探索多種技術路徑。如有通過引入可解釋性模塊或后驗可視化工具,對決策過程進行透明化;還有利用Diffusion模型對軌跡生成進行優化,確保控制指令的平滑性與穩定性。同時,將VLA與傳統規則引擎或模型預測控制(MPC)結合,以混合架構提高安全冗余和系統魯棒性也成為熱門方向。

未來,隨著大模型技術、邊緣計算和車載硬件的持續進步,VLA有望在自動駕駛領域扮演更加核心的角色。它不僅能為城市復雜道路提供更智能的駕駛方案,還可擴展至車隊協同、遠程遙控及人機交互等多種應用場景。智駕最前沿以為,“視覺-語言-動作”一體化將成為自動駕駛技術的主流方向,推動智能出行進入新的“端到端2.0”時代。

VLA作為一種端到端多模態融合方案,通過將視覺、語言和動作三大要素集成到同一模型中,為自動駕駛系統帶來了更強的泛化能力和更高的交互靈活性。盡管仍需解決可解釋性、安全驗證與算力優化等挑戰,但其革命性的技術框架無疑為未來智能駕駛的發展指明了方向。隨著業界不斷積累實踐經驗、優化算法與完善安全體系,VLA有望成為自動駕駛領域的“下一代技術基石”。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Vla
    Vla
    +關注

    關注

    0

    文章

    8

    瀏覽量

    5758
  • 自動駕駛
    +關注

    關注

    788

    文章

    14248

    瀏覽量

    169994
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    自動駕駛中常的魯棒性是

    隨著自動駕駛技術的快速發展,魯棒性(Robustness)成為評價自動駕駛系統的重要指標之一。很多小伙伴也會在自動駕駛相關的介紹中,對某些功能用魯棒性進行描述。一魯棒的系統能夠在復雜
    的頭像 發表于 01-02 16:32 ?7020次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的魯棒性是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    FPGA在自動駕駛領域有哪些應用?

    FPGA(Field-Programmable Gate Array,現場可編程門陣列)在自動駕駛領域具有廣泛的應用,其高性能、可配置性、低功耗和低延遲等特點為自動駕駛的實現提供了強有力的支持。以下
    發表于 07-29 17:09

    【話題】特斯拉首起自動駕駛致命車禍,自動駕駛的冬天來了?

    `特斯拉首起自動駕駛致命車禍,自動駕駛的冬天來了?“一致命的事故一定是由多個小的錯誤組成的。”  7月初,特斯拉發表博客敘述了NHTSA(美國國家公路交通安全管理局)正在著手調查第一起Tesla
    發表于 07-05 11:14

    自動駕駛真的會來嗎?

    。autopilot是用戶駕駛的一輔助功能,可以幫助駕駛員在開車過程中進行更好的判斷、更輕松的操作。這個Google等進行的自動駕駛有明顯的不同。”張璐說。美國高速公路安全委員會(N
    發表于 07-21 09:00

    自動駕駛的到來

    的攻擊方式有幾種,一是攻擊自動駕駛的外部傳感器,科恩實驗室對于特斯拉的模擬攻擊實驗是一很好的例子。在這方面,使用多傳感器融合,綜合決策,而不是只依賴某個傳感器,是較好的解決辦法。另外,在傳感器中加入抗
    發表于 06-08 15:25

    如何讓自動駕駛更加安全?

    開放道路測試牌照,許可在公共道路上測試自動駕駛技術,參與測試的企業將通過道路測試來不斷驗證自動駕駛技術的成熟度。專家介紹,從自動化程度角度看,自動駕駛一般可分為4
    發表于 05-13 00:26

    自動駕駛汽車的處理能力怎么樣?

    對環境和擁堵產生積極影響。市場調研公司ABI Research預測:到2030年,道路上四分之一的汽車將會是自動駕駛汽車。行業專家已經為自動駕駛的發展定義了五級別。 每個級別分別描述了汽車從
    發表于 08-07 07:13

    自動駕駛系統設計及應用的相關資料分享

    作者:余貴珍、周彬、王陽、周亦威、白宇目錄第一章 自動駕駛系統概述1.1 自動駕駛系統架構1.1.1 自動駕駛系統的三層級1.1.2 自動駕駛
    發表于 08-30 08:36

    自動駕駛技術的實現

    的帶寬有了更高的要求。從而使用以太網技術及中央域控制(Domain)和區域控制(Zonal)架構是下一代車載網絡的發展方向。然而對于自動駕駛技術的實現,涉及到感知、規劃、執行三層面。由于車輛行...
    發表于 09-03 08:31

    自動駕駛中常的SLAM到底是

    ?這兩問題。目前,自動駕駛技術主要依賴高精地圖和RTK(實時動態定位)系統完成高精度定位。然而,這種方法的實現成本高昂,需要依賴于完善的基礎設施,且在動態環境中適應性不足。為此自動駕駛工程師提出了另一種更具靈活性和
    的頭像 發表于 11-21 15:17 ?1556次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的SLAM到底是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛大模型中常的Token是?對自動駕駛有何影響?

    、多模態傳感器數據的實時處理與決策。在這一過程中,大模型以其強大的特征提取、信息融合和預測能力為自動駕駛系統提供了有力支持。而在大模型的中,有一“Token”的概念,有些人看到后或許會問: Token是
    的頭像 發表于 03-28 09:16 ?289次閱讀

    自動駕駛中常的“NOA”是

    近年來,自動駕駛技術發展迅速,業界不斷探索如何在復雜交通場景中實現真正的無人駕駛。城市NOA作為自動駕駛的一項前沿技術,正成為各大廠商相互爭奪的關鍵技術。 何為NOA? NOA,全稱
    的頭像 發表于 04-09 09:03 ?571次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛行業常的高階智駕是

    的調整,也見證了這個行業的技術演進。“高階智駕”作為現階段在各大車企發布會經常提到的一詞,也預示著自動駕駛行業正加速走入下半場。高階智駕不僅在功能上遠超傳統的高級輔助駕駛系統,更在核心技術、系統架構以及整體安
    的頭像 發表于 04-18 12:24 ?289次閱讀
    <b class='flag-5'>自動駕駛</b>行業常<b class='flag-5'>提</b>的高階智駕是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“點云”是

    ?對自動駕駛有何影響? 點云是? 點云(Point Cloud)是一種在三維空間中由大量離散點組成的數據集合,每個點包含自身的笛卡爾坐標(X、Y、Z),并可附帶顏色、強度、時間戳
    的頭像 發表于 05-21 09:04 ?214次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點云”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的HMI是

    [首發于智駕最前沿微信公眾號]在自動駕駛汽車領域,HMI(Human–Machine Interface,人機交互界面)正成為很多車企相互競爭的一大領域。之所以如此,是因為在車輛從“人控”過渡到“機
    的頭像 發表于 06-22 13:21 ?128次閱讀
    主站蜘蛛池模板: 免费又爽又黄禁片视频在线播放 | 男人日女人免费视频 | 国产福利久久 | 亚洲天堂爱爱 | 特黄特色的大片观看免费视频 | 一级午夜| 日本一区二区三区在线观看视频 | 免费a在线看 | 日韩成人一级 | 色吧亚洲欧美另类 | 色天天天天综合男人的天堂 | 国产精品免费拍拍1000部 | 日本三级欧美三级香港黄 | 国产精品人人爱一区二区白浆 | 国内自拍露脸普通话对白在线 | 婷婷丁香色综合狠狠色 | 激情五月视频 | 扒开末成年粉嫩的小缝强文 | 禁h粗大太大好爽好涨受不了了 | www.av网| 欧美亚洲一区二区三区在线 | 国产精品欧美一区二区三区不卡 | 亚洲色图吧 | 狠狠色网 | 色骚网| 喷潮白浆直流在线播放 | 天天干夜夜骑 | 免费播放特黄特色毛片 | 国产激烈无遮挡免费床戏视频 | 一区二区三区四区免费视频 | 欧美亚洲h在线一区二区 | 午夜视频1000 | 美女丝袜长腿喷水gif动态图 | 成人免费午间影院在线观看 | 日本写真高清视频免费网站网 | 免费人成在线观看视频播放 | 看全色黄大色大片免费久久 | 日韩三级免费看 | dy888午夜秋霞影院不卡 | 手机看片福利日韩国产 | 欧美一级视频在线 |