如果故事的開頭,從端到端和模塊化兩種自動駕駛系統的發展溯源講起,人們會發現,路線之爭對于高階智駕而言并非是問題的關鍵。系統的性能、可靠性、安全性等因素需要以人為核心尋找合理的“設計交集”,從而共同約束相關發展路徑的實際應用和效果呈現。
自2024年開始,城區NOA普及速度不斷加快。然則在一些研究機構的報告中顯示,截至2023年底,只有3%的城區NOA滲透率說明其中仍有明顯的應用鴻溝等待跨越。其中原因就是現實的隨機性為正確預測下一秒造成了極大的困難,反映到實際自動駕駛行為中的表現就是:決策保守,應對死板、機械,效率低。在地平線看來,選擇一條可達成的發展路徑需要遵循“用戶價值”,從場景出發,地平線全新一代智駕方案Horizon SuperDrive(下簡稱“SuperDrive”)為了解決城區的規控難題采用了更擬人、更像老司機的“交互博弈”。
讓智駕系統更“老練”的交互博弈
什么樣的智能駕駛能被稱為老司機?首先來看一些SuperDrive在城市中的行駛片段——
從以上場景的自動駕駛行為可以看到,SuperDrive系統已經具備一個老練司機的開車本能。例如,當遇到騎行人或行人主動避讓、等待車輛先行時,它會果決判斷、不猶豫地行駛過去,而不是僵硬地只滿足行人先行的約束條件(為了安全);直行遇到左轉高頻場景,在判定擁有路權的時候SuperDrive會選擇徑直過去,而不會像其他系統一樣躊躇;及時檢測到前方占道車輛然后減速繞行,整個繞行路徑優雅從容,讓駕駛者獲得如同自己正常駕駛一樣的體驗,并且有效避免了當識別到前方占道車輛減速剎停時,無法主動繞行最終被迫接管的窘境。
SuperDrive想要做的,就是能夠平順地處理很多場景(優雅),不會僅為了安全而不去做一些人會做的博弈行為(不慫),并且能夠感知到車的狀態,像人一樣在一個相對長的時間周期里通過思考明白要如何去行動,而不會很猶豫、糾結,出現方向盤無目的地亂擺導致車身不明所以地搖晃等(從容篤定),可謂謀定而后動。
其背后,有兩大技術支撐。一個是讓智駕系統“看”得更明白的“端到端感知架構”;另一個是讓智駕系統“想”得清楚的“交互式博弈算法”。后者作為整個智駕系統的決策規劃核心,最主要的是為高階智駕提供了一種思維路徑,而非一種設計定式。在實現端到端感知的基礎上,SuperDrive系統還需要具備超強的博弈能力,才能針對復雜多元的城區場景以及中國式交通參與者,實現“優雅不慫,從容篤定”。
SuperDrive的整個規控系統的輸入擁有Tensor級別的先驗和實時結果,憑借著系統內的搜索模塊,在大量數據和可能性中尋找最優解或相關信息,同時考慮時間和空間因素,根據輸入數據和推理結果,生成物體或事件隨著時間和空間變化的軌跡,然后做出預測或決策,制定運動規劃,最終控制車子做出相應的駕駛行為。
地平線認為,上述所有的處理過程都會有一個交互式預測決策神經網絡的Core,能夠讓系統真正的實現交互式博弈,整個推理過程最重要的是輸出Plan/Prediction Pairs,包含自車和他車的,這樣才能更準確的給出是搶還是讓的決策,且這一過程并不是一次性的,而是所有可能性在每一個“Planning Cycle”里能夠調用推演,這能使得系統能夠真的像人一樣在“反復博弈、尋求最優解”,而不是單向從A問題到B結論般的直白、僵硬。
但當輸入的信息超越了過往的“經驗”,系統則能夠自行做出交互式思考和判斷,從而生成合理的駕駛行為,整體的交互博弈,能夠反復迭代、推演、強化,在不斷的進化中,離“更擬人”無窮近。這相對于之前串行預測決策的規控有著很大的區別。
在目前的應用試驗中,除了本節上述的場景外,地平線SuperDrive在面對施工區避讓、城市環島通行、路口交互-動態Driveline、效率變道、擁堵變道、擁堵匯流等城市典型場景時,均能夠給用戶帶來優雅不慫的智能駕乘體驗。典型動態現場案例如下:
背后思考:慢思考
相對于傳統智駕領域的決策規劃而言,交互博弈是更復雜的一種決策行為。地平線創始人兼CEO余凱博士介紹,高階智駕系統不能僅僅只在簡單的case里靠直覺去處理,在復雜的case里,也能夠通過自己的自主思考、博弈去“舉一反三”,也就是說自主思考的背后需要邏輯推演鏈條更長的反復思考,最終要求達到anytime、anywhere的反復博弈,這時的車子仿佛擁有了一顆“大腦”,能夠全天候、全場景地仿真、想象、演繹甚至腦補。
由此可以引申出SuperDrive設計交互博弈背后的思維動因,地平線稱之為“慢思考”。“慢思考”這個概念來自于美國心理學家丹尼爾·卡尼曼的著作《思考,快與慢》。丹尼爾·卡尼曼認為,人類大腦有快與慢兩種做決定的方式。快思考依賴情感、記憶和經驗迅速作出判斷,它見聞廣博,能夠迅速對眼前的情況做出反應,但是這樣的思考過程固守“眼見即為事實”的原則,很容易被蠱惑進而上當;而慢思考通過調動注意力來分析和解決問題,它擁有一個不斷反芻的思維過程,比較慢,不容易出錯,但有時也會偷懶,選擇讓“快思考”直接接管,用直覺來“走捷徑”。地平線認為,智駕系統的交互博弈應當像人一樣思考,更多的時候強調“快和慢”相結合,以便能夠在動態和不可預測的環境中做出更加合理和有效的決策。
現如今,很多決策規劃模塊的開發過程中,隨著應用場景無限趨于開集形態,依賴人類工程師不斷手寫的(if.else,搜索,優化)規則去對抗自動駕駛問題不僅在技術上陷入窮途末路,而且也沒有無上限的資金用以支持類似的“黑洞投入”。智能駕駛目前遇到的最大瓶頸是“開集和非白名單”的問題,僅靠if.else很難精確地描述并處理不斷變幻的駕駛場景,因此在智能駕駛系統中,人們逐漸采取神經網絡替換掉手寫規則,憑借數據驅動和大模型解決人工短板。
但是地平線想的更進一步,雖然基于鑒別式或者單模態生成式的機器學習技術能夠通過數據的閉環,經由算力支持換來了效率,但是仍然無法解決“開集和白名單”的問題,越來越多的判定已經達成共識,機器學習技術需要具有Common sense(常識),即在沒有特定任務的訓練樣本的情況下,讓模型完成任務(Zero-shot)。這就涉及到上文所述的“開城”和“ODD無限延展”的問題,智能駕駛的未來就是要讓整個決策規劃無限適應和處理從來沒有見過的case,而不是遇到問題就簡單粗暴地“confused”,或者直接選擇人為接管。
因此,基于“快、慢”思考的定義,地平線設計SuperDrive的時候也充分注意到了有些場景難以通過直接反饋的方式去處理,而是要像下棋一樣經過步驟推演,最好能夠舉一反三(即泛化能力),而不是只有見到才能學到。針對一些全新的場景,地平線希望做到的是系統能夠完全“從0到1”,這個“0”并非是數學意義上的“空集”,而是能夠在原有的經驗(這個經驗有可能與當下場景相關、準相關甚至無關)之上,通過自行比對、自主思考、經驗推理、不斷模仿,生成更加理性的、符合現實需要的決策,而不是將一些行駛標準孤立、割裂地看待,導致出現“為了安全能走卻不走”、“遇到突發狀況毫無變通”的狀況。地平線認為,讓系統在交互中學會“博弈”,才能跨過智能駕駛迭代過程中的“嘆息之墻”。
軟硬協同:“1+1>2”
從可用躍遷至好用,對于地平線而言,無論是端到端感知還是交互博弈,最終都需要通過高效的硬件架構去運行。換句話說,硬件實力決定了迭代底盤,與此同時軟件和硬件彼此協同才能發揮出“1+1>2”的效用。在交互博弈方面,由于跟以前的串行神經網絡推理模式不一樣,需要相對通用的計算單元和相對快速的專用計算單元來完成博弈,因此BPU架構也能更加快速高效地處理Close-Loop交互。
基于BPU Nash架構的征程6,相比上一代性能上有了大幅提升,其中包含強大的并行浮點計算能力,以及特別優化的超越函數,存儲性能上也進行了大面積優化,能夠用更加無感的方式、更快的速度實現各種推理過程。給新一代的計算架構起名為BPU Nash,是意在致敬偉大的數學家約翰·納什以及他的著名理論——納什博弈(納什均衡)。所謂的納什博弈,描述了在博弈過程中,無論對方的選擇如何,當事人一方都會選擇某個確定的策略,任何一方在此策略組合下單方面改變自己的策略(他方策略不變),都不會提高自身的收益。這個理論形象地勾勒了地平線在交互博弈算法構建過程中想要達到的最佳狀態:如果這個系統能夠達到納什博弈的水平,那么完成對于“人類操作”的替代、實現自動駕駛就不再是空想。
“單點的算法突破或者算力性能突破,都不是高階智駕達到好用的關鍵,充分發揮硬件和軟件的協同效應,并以極致開放打造極致效率,才是抵達高階智駕終局的最佳路徑。”余凱表示。在地平線的邏輯里,軟件與硬件結合的緊密程度,不僅關乎計算效率和能耗降低,也是確保系統和硬件的協同進步、提升整體系統性能效率的核心。
這同樣也是一種全新的開集:實際駕駛環境需要系統進行徹底的交互博弈,用以完成“擬人化”的終極進化,而無論是端到端還是模塊化發展路徑,都需要硬件基礎的算力支持,在不斷的迭代過程中,軟件層面需要為硬件配備找到效率的邊際拐點,硬件需要根據場景、模型、數據的不斷演進,在提供基礎算力的同時完成自我革新。
因此,軟硬協同的邏輯最終孕生的是一個更加廣袤的產業生態,軟硬結合的產業支柱是所有的參與者開放協作,由此才能在大模型框架、深度學習語料、算法升級和軟硬結合等層面實現全業態式的互補。目前,地平線已經搭建了國內最為成熟、高效、開放的生態體系之一,并與全球超過30家車企達成了前裝量產合作,合作的量產車型已經超過110款。
高階智駕的未來,將是一個不斷擬人、類人的過程。
從響應人,到服務人,再到解放人,智能駕駛在不斷演進的過程中,完成的是人的高維延伸,用優雅不慫、從容篤定形容的高階智駕系統,一定能夠像“老司機”一樣預測、推理、學習、決策。在這里,讓我們放下路徑之爭的自我偏見,聚焦到智能駕駛讓人類生活更安全、更美好的目標本質。當高階智駕走向平權時代,選擇一種“可達成”的路線,是地平線的現實選擇,而當智駕產業邁向以用戶、市場需求為導向的公眾利他之時,多方博弈之下,一定會窮舉出一個產業發展核心:那就是在產品量產、用戶體驗、公眾利益互相交融的智駕市場,技術普惠最終會給體驗普惠,讓渡出一個“體驗上更擬人、技術上更類人”的落地空間。
-
智能駕駛
+關注
關注
3文章
2598瀏覽量
48945 -
自動駕駛
+關注
關注
785文章
13942瀏覽量
167090 -
地平線
+關注
關注
0文章
354瀏覽量
15040
原文標題:SuperDrive背后的“思考”:如何讓智駕決策更像老司機
文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
地平線SuperDrive相關問答
地平線SuperDrive首發三大黑科技,決勝智能化競爭下半場
![<b class='flag-5'>地平線</b><b class='flag-5'>SuperDrive</b>首發三大黑科技,決勝智能化競爭下半場](https://file1.elecfans.com/web3/M00/06/08/wKgZO2eHDfKAOkq-AAjj6LgRzLA240.png)
地平線SuperDrive首發三大黑科技
地平線榮獲第九屆鈴軒獎前瞻類智能駕駛金獎
地平線榮獲比亞迪“最佳合作伙伴獎”
智駕科技企業地平線登陸港交所
地平線SuperDrive實現12城泛化,將于2025年首發量產
![<b class='flag-5'>地平線</b><b class='flag-5'>SuperDrive</b>實現12城泛化,將于2025年首發量產](https://file1.elecfans.com/web2/M00/09/7B/wKgaomb46l2ANp14AASQKwF4rqM176.png)
奇瑞與地平線深化智駕合作,共創智能駕駛新篇章
地平線技術開放日:余凱勾勒智能駕駛新藍圖
地平線征程家族出貨量破600萬,智駕計算方案領跑市場
東軟睿馳NeuSAR成功適配地平線征程6系列
地平線高階智駕系統SuperDrive重塑交通出行變革
地平線發布新一代Horizon SuperDrive?全場景智能駕駛解決方案
![<b class='flag-5'>地平線</b>發布新一代Horizon <b class='flag-5'>SuperDrive</b>?全<b class='flag-5'>場景</b>智能駕駛解決<b class='flag-5'>方案</b>](https://file1.elecfans.com/web2/M00/D9/D2/wKgaomYpr6CAFlHkAAA7onV3Hfk794.png)
官宣10家首批量產合作車企,地平線征程6發布即爆款
![官宣10家首批量產合作車企,<b class='flag-5'>地平線</b>征程6發布即爆款](https://file1.elecfans.com/web2/M00/D8/CA/wKgZomYpkyCAOPXbAAIy1WJfF-s143.png)
評論