在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為小米自動駕駛Occupancy Network對決

佐思汽車研究 ? 來源:佐思汽車研究 ? 2024-04-28 14:35 ? 次閱讀

2023年6月計算機視覺學術圈CVPR舉辦兩場自動駕駛研討會,一個是端到端自動駕駛研討會 (End-to-End Autonomous Driving Workshop),另一個是視覺中心自動駕駛研討會 (Vision-Centric Autonomous Driving Workshop)。由此又引出4項算法任務挑戰賽,其中:

第一項是OpenLane Topology即開放路口車道線拓撲矢量化構建,第一名是曠視,第二名是輕舟智航,理想L6自動駕駛供應商。第三名則是美國AMD,第四名是美團。

第二項是在線高精度地圖繪制,第一名是曠視的自動駕駛子公司邁馳智行,第二名是美國獨立研究者,第三名是上海交通大學。第十名是廣汽研究院。

第四項是nuPlan即自動駕駛規劃,第一名是德國Tübingen大學,第二名是地平線,第三名是初創公司云驥智行。

第三項是最具價值的3D Occupancy network預測,也就是特斯拉帶火的占用網絡,共有149個團隊參加比賽,其中不乏業內巨頭,包括英偉達、小米、上汽、華為、海康威視

bb01c242-0449-11ef-a297-92fbcf53809c.png

圖片來源:https://opendrivelab.com/challenge2023/

占用網絡挑戰賽前10名,第一名有15000美元的獎金。第四名到第十名可算第三梯隊,差距很小。英偉達遙遙領先。韓國自動駕駛初創公司42dot與小米可算第二梯隊。

比賽中使用的Occ數據集來自nuScenes,要求選手在僅使用圖像這個模態的情況下,對200x200x16的3D體素空間的占據情況進行預測,其中評價指標采用mIoU,并且將僅對圖像中的可視范圍中的預測結果進行評估。在比賽中,一共有兩個Baseline可供選擇,一個是官方提供的基于BEVFormer框架的實現,另一個則是基于BEVDet框架實現的,也分別代表了在3D目標檢測現在主流的兩個實現路線,LSS和Transformer。兩種Baseline都將原來輸入檢測頭的特征,從BEV空間拉伸成200x200x16的3D體素空間,然后接上一個簡單的語義分割頭,來對3D占據的結果進行預測。

第一名英偉達的FB-OCC,其成功的關鍵還是大模型,英偉達使用了比較新的InterImage-H來作為他們的Backbone,而為了更好的應用InterImage-H,作者還將其在原先在COCO的預訓練基礎上,在object365上也進行了預訓練,使其更好的應用在此任務上。InternImage-H參數多達10.8億個,當然大模型也不是想用就能用,太大的模型容易出現過擬合,且消耗運算和存儲資源也較多。

最新2D圖像骨干網對比

bb0b591a-0449-11ef-a297-92fbcf53809c.png

圖片來源:arxiv.org

上表中,特斯拉使用META的RegNet,參數為8400萬,消耗運算資源很少,得分82.9也算不低,小米UniOcc使用META的ConvNeXt-B,參數8900萬,消耗運算資源最少,得分83.8,華為RadOcc使用微軟的Swin-B,參數8800萬,相對ConvNeXt-B消耗運算資源幾乎翻倍,得分83.5,略高。得分最高的是ConvNeXt-XL,高達87.8,參數3.5億個,消耗運算資源是Swin-B的十倍還多。

第二名是42dot,一家韓國初創公司,成功的關鍵也是大模型,其2D Backbone用了InterImage-XL,有3.35億參數,3D Backbone用了微軟的Swin-V2-L,有30億參數,但提升不大。

重點來看第三名的小米汽車,論文題目為《UniOcc: Unifying Vision-Centric 3D Occupancy Prediction with Geometric and Semantic Rendering》,迄今為止在網上可以找到的小米汽車的三篇論文都是圍繞Occupancy來展開的,足見小米對Occupancy的重視程度。

UniOcc框架

bb2e8b92-0449-11ef-a297-92fbcf53809c.png

圖片來源:《UniOcc: Unifying Vision-Centric 3D Occupancy Prediction with Geometric and Semantic Rendering》

小米和接下來要說到的華為都使用了比較新穎的知識蒸餾技術,即教師學生模型,這是一種半監督深度學習方式,最早由谷歌提出,發布于2015年3月,論文為《Distilling the Knowledge in a Neural Network》。知識蒸餾技術是一種模型壓縮方法,是一種基于Teacher-Student模型的訓練方法。知識蒸餾(Knowledge Distillation),顧名思義就是將一個復雜的大模型的“知識”,蒸餾到一個簡單的小模型中,比較類似于教師(大模型)向學生(小模型)傳授(蒸餾)知識。這樣做主要是因為大模型部署起來成本驚人,通常最低都是8張英偉達A100這樣的計算和存儲資源,成本最低也在5萬美元以上,在車上完全不可能部署大模型,必須采用蒸餾模式。在Teacher-Student模型中通常有兩個階段:

① 教師模型訓練:首先訓練一個較大或復雜的教師模型,它通常具有更多的參數和復雜性,并能夠在訓練數據上表現得更好。

② 學生模型訓練:接著,使用教師模型的輸出作為輔助目標,指導較簡化的學生模型進行訓練。學生模型嘗試去模仿教師模型的預測結果,以此來學習教師模型的“知識”。在訓練學生模型時,通常會利用教師模型的軟標簽(soft labels)或教師模型的隱藏層表示(logits)作為額外的監督信號,結合有標簽數據進行訓練。這個過程中,學生模型的目標是盡量擬合教師模型的預測結果,并同時擬合真實的標簽信息

有些外行把軟標簽(標注,標記)說成是無標簽,說什么自動駕駛數據集完全不需要標簽了,這當然是大錯特錯,絕對的無標簽無監督深度學習永遠不可能實現,頂多是半監督,硬標簽是1或者0,沒有中間狀態,軟標簽則是連續分布的概率。軟標簽可以用教師模型的SOFTMAX層輸出的類別概率做為軟標簽,某種意義上這可算是自動生成的標簽,無需人工添加。教師模型還是需要標簽數據,還是需要人工標注。

小米的創新有三點,一是使用NeRF的體渲染(volume rendering)來統一2D和3D表示監督的通用解決方案,二是通過知識蒸餾做深度預測訓練,三是用低成本的體渲染監督學習代替成本高昂稀缺的3D占用網絡語義標簽監督學習。

NeRF神經輻射場,不同于傳統的三維重建方法把場景表示為點云、網格、體素等顯式的表達,它獨辟蹊徑,將場景建模成一個連續的5D輻射場隱式存儲在神經網絡中,只需輸入稀疏的多角度帶pose的圖像訓練得到一個神經輻射場模型,根據這個模型可以渲染出任意視角下的清晰的照片。通俗來講就是構造一個隱式的渲染流程,其輸入是某個視角下發射的光線的位置o,方向d以及對應的坐標(x,y,z),送入神經輻射場Fθ得到體密度和顏色,最后再通過體渲染得到最終的圖像。顯式是離散的表達,不能精細化,導致重疊等偽影,耗費內存,限制了在高分辨率場景的應用。隱式是連續的表達,能夠適用于大分辨率的場景,而且不需要3D信號進行監督。

NeRF需要兩個MLP,一個負責 Coarse,一個負責 Fine,因此計算量比較大,存儲資源要求也比較高。自動駕駛領域使用NeRF還是相當少見的,因為它太消耗運算和存儲資源了,同時自動駕駛的視角有限,一般是5個視角,想做好NeRF相當困難。

小米的知識蒸餾DTS框架

bb56ffd2-0449-11ef-a297-92fbcf53809c.png

圖片來源:《UniOcc: Unifying Vision-Centric 3D Occupancy Prediction with Geometric and Semantic Rendering》

小米的知識蒸餾DTS框架,在訓練中使用visible masks,使用更強的預先訓練的骨干,增加體素分辨率,以及實現Test-Time Augmentation(TTA)。大部分人都是使用英偉達的LSS算法獲得深度,小米的DTS可謂獨樹一幟。

第四名來自上汽AI LAB,其整體框架設計采用BEVDet的設計思路,主要提出利用多尺度信息來進行訓練和預測以及一種解耦頭的預測方法。論文異常簡單,只有4頁。

上汽OCC架構

bb763f28-0449-11ef-a297-92fbcf53809c.png

圖片來源:上汽

最后來看華為的,華為由華為諾亞方舟實驗室出面,諾亞方舟實驗室是華為三級部門,隸屬于中央研究院。內地主要分布在北京、深圳、上海、西安。下面又分成很多組,比如計算視覺、終端視覺、自動駕駛、網絡大腦、NLP等等。主要的工作內容就是科研和落地,主要做前沿研究,之所以取名諾亞方舟就是說當華為出現大洪水那樣級別的災難時,諾亞方舟實驗室的成果足以讓華為走出困境。

最初華為諾亞方舟并未提供論文,直到2023年底才提供論文,論文題目《RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation》華為論文換了Occ3D的測試數據集,最好成績高達55.09,比第一名英偉達還高,當然不是一個測試數據集,沒辦法直接對比,但華為應該在挑戰賽后還是做了不少改進的地方。

華為也是采用知識蒸餾的教師學生模式。

華為RadOcc架構

bb8e1814-0449-11ef-a297-92fbcf53809c.png

圖片來源:《RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation》

華為RadOcc架構,思路和小米基本一致,也用了NeRF。教師網絡是多模態模型,而學生網絡僅需要相機輸入,無需激光雷達。兩個網絡的預測將用于通過可微分體渲染(differentiable volume rendering)生成渲染深度和語義。

bba9f264-0449-11ef-a297-92fbcf53809c.png

圖片來源:《RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation》

現有的方法如圖a的是將特征或 logits 進行對齊。RadOcc的核心思想是對教師模型和學生模型生成的渲染結果進行對齊,如圖(b)所示。使用相機的內參和外參對體素特征進行體渲染Volume Rendering,能夠從不同的視點獲得相應的深度圖和語義圖。為了實現渲染輸出之間更好的對齊,引入了新穎的渲染深度一致性(RDC)和渲染語義一致性(RSC)損失。一方面,RDC 損失強制光線分布(ray distribution)的一致性,這使得學生模型能夠捕獲數據的底層結構。另一方面,RSC損失利用了視覺基礎模型的優勢,并利用預先提取的segment進行affinity蒸餾。允許模型學習和比較不同圖像區域的語義表示,從而增強其捕獲細粒度細節的能力。

bbc3ebb0-0449-11ef-a297-92fbcf53809c.png

圖片來源:《RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation》

采用視覺基礎模型(VFM),即SAM,將segments提取到原始圖像中。對每個segment 中渲染的語義特征進行segment聚合,獲得affinity matrix 。

自動駕駛的理論基礎或者說骨干被META、谷歌、英偉達和微軟這些巨頭壟斷,自動駕駛算法公司能做的就是應用層的微調,大家的技術水平都差不多。另一方面理論基礎在沒有實現重大突破之前,自動駕駛難有實質性進展。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    34537

    瀏覽量

    253013
  • 小米
    +關注

    關注

    70

    文章

    14387

    瀏覽量

    144942
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167013
  • 大模型
    +關注

    關注

    2

    文章

    2551

    瀏覽量

    3171

原文標題:華為小米對決自動駕駛Occupancy Network

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    華為宋曉迪出席自動駕駛網絡峰會

    第10屆全球超寬帶高峰論壇(UBBF 2024)期間,華為運營商業務首席營銷官宋曉迪博士出席自動駕駛網絡峰會,并發表主題致辭。會上,宋曉迪分享了華為與合作伙伴的產業發展及商業實踐成果。
    的頭像 發表于 11-04 16:08 ?522次閱讀

    自動駕駛汽車安全嗎?

    隨著未來汽車變得更加互聯,汽車逐漸變得更加依賴技術,并且逐漸變得更加自動化——最終實現自動駕駛,了解自動駕駛汽車的安全問題變得非常重要,這樣你才能回答“自動駕駛汽車安全嗎”和“
    的頭像 發表于 10-29 13:42 ?613次閱讀
    <b class='flag-5'>自動駕駛</b>汽車安全嗎?

    自動駕駛HiL測試方案案例分析--ADS HiL測試系統#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發布于 :2024年10月22日 15:20:19

    自動駕駛技術的典型應用 自動駕駛技術涉及到哪些技術

    自動駕駛技術的典型應用 自動駕駛技術是一種依賴計算機、無人駕駛設備以及各種傳感器,實現汽車自主行駛的技術。它通過使用人工智能、視覺計算、雷達、監控裝置和全球定位系統等技術,使自動駕駛
    的頭像 發表于 10-18 17:31 ?1016次閱讀

    自動駕駛HiL測試方案——攝像頭仿真之視頻注入#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發布于 :2024年10月17日 15:18:41

    自動駕駛HiL測試方案 ——場景仿真3D演示#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發布于 :2024年10月16日 10:55:35

    自動駕駛HiL測試方案介紹#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發布于 :2024年10月12日 18:02:07

    FPGA在自動駕駛領域有哪些優勢?

    FPGA(Field-Programmable Gate Array,現場可編程門陣列)在自動駕駛領域具有顯著的優勢,這些優勢使得FPGA成為自動駕駛技術中不可或缺的一部分。以下是FPGA在自動駕駛
    發表于 07-29 17:11

    FPGA在自動駕駛領域有哪些應用?

    FPGA(Field-Programmable Gate Array,現場可編程門陣列)在自動駕駛領域具有廣泛的應用,其高性能、可配置性、低功耗和低延遲等特點為自動駕駛的實現提供了強有力的支持。以下
    發表于 07-29 17:09

    小米汽車招募自動駕駛技術人才

    王乃巖在圖森未來期間主要負責研發及管理工作,包括L2級輔助駕駛以及L4級自動駕駛方案的開發實施。他的加盟無疑將加速小米智駕技術的發展進程。
    的頭像 發表于 05-23 10:20 ?679次閱讀

    特斯拉在華推進全自動駕駛

    特斯拉自動駕駛技術入華成為市場焦點。馬斯克提出的“無人駕駛出租車”概念正引領特斯拉在中國市場加速推進自動駕駛技術的創新。
    的頭像 發表于 05-11 09:39 ?480次閱讀

    特斯拉的Occupancy Network占用網絡如何解決無法識別物體的難題呢?

    Occupancy Network并非特斯拉發明,最先提出Occupancy Network的是2018年的論文《Occupancy Net
    的頭像 發表于 04-16 17:29 ?1891次閱讀
    特斯拉的<b class='flag-5'>Occupancy</b> <b class='flag-5'>Network</b>占用網絡如何解決無法識別物體的難題呢?

    小米自動駕駛技術:算法篇

    小米SOGDet的網絡架構,并無獨特之處,畢竟網絡基礎都是谷歌和META構建的。目前頂級自動駕駛網絡基本都是三部分,其中骨干Backbone部分,還是基于CNN,沒辦法,Transofrmer運算量太大,無法使用,大家基本還是用ResNet50/100。
    發表于 04-15 14:34 ?759次閱讀
    <b class='flag-5'>小米</b><b class='flag-5'>自動駕駛</b>技術:算法篇

    未來已來,多傳感器融合感知是自動駕駛破局的關鍵

    的Robotaxi運營。這標志著L4級自動駕駛迎來了新的里程碑,朝著商業化落地邁進了一大步。中國的車企也不甘落后:4月7日,廣汽埃安與滴滴自動駕駛宣布合資公司——廣州安滴科技有限公司獲批工商執照。廣汽埃安
    發表于 04-11 10:26

    自動駕駛發展問題及解決方案淺析

    隨著科技的飛速進步,自動駕駛汽車已經從科幻概念逐漸轉變為現實。然而,在其蓬勃發展的背后,自動駕駛汽車仍面臨一系列亟待解決的問題和挑戰。本文將對這些問題進行深入的剖析,并提出相應的解決方案,以期為未來自動駕駛
    的頭像 發表于 03-14 08:38 ?1236次閱讀
    主站蜘蛛池模板: 性满足久久久久久久久 | 久久 在线播放 | 亚洲黄网站wwwwww | 激情午夜婷婷 | 亚洲综合精品一区二区三区中文 | 2021国产精品自在拍在线播放 | 欧美日韩一日韩一线不卡 | 99久久99| 国产精品va一区二区三区 | 婷婷六月色| 亚洲国产精品日韩专区avtube | 国产精品黄网站免费观看 | 天天射夜夜爽 | 中国毛茸茸bbxx| 国产精品 视频一区 二区三区 | 美女被曹 | 天天操 夜夜操 | 天天色综合三 | 中国又粗又大又爽的毛片 | 亚洲成a人v在线观看 | 免费三级pq | 日本xxxx69| 欧美在线色视频 | 国产成人啪精品午夜在线播放 | 六月丁香婷婷综合 | 222.www免费观看| 女生扒开尿口让男生舔 | 毛片毛多 | 欧美影院一区二区三区 | 亚洲二区在线 | 亚洲第一视频在线 | 91p0rn永久备用地址二 | 狠狠色噜噜狠狠狠狠2021天天 | 免费a级毛片出奶水 | 免费观看黄色网址 | 国产精品亚洲玖玖玖在线靠爱 | 欧美伦理一区二区三区 | 九九视频只有精品 | 亚洲午夜在线视频 | 特级黄| 视频在线观看高清免费大全 |