Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)

10月31日訊，自動駕駛領(lǐng)域的先鋒Waymo，作為Alphabet旗下的一員，長久以來將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊視為其在自動駕駛競賽中脫穎而出的關(guān)鍵。如今，Waymo再邁新步，為其機器人出租車業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語言模型（MLLM）“Gemini”的全新訓(xùn)練模型——“端到端多模態(tài)自動駕駛模型”（EMMA）。

Waymo最新發(fā)布的研究論文揭示了EMMA模型的面紗。這一創(chuàng)新的端到端訓(xùn)練模型能夠解析傳感器數(shù)據(jù)，預(yù)測“自動駕駛車輛的未來行駛軌跡”，從而輔助Waymo的無人駕駛車輛做出精準(zhǔn)決策，無論是選擇行進路線還是規(guī)避障礙物。

尤為引人注目的是，這是自動駕駛領(lǐng)軍企業(yè)首次公開表示計劃將MLLM技術(shù)融入其核心業(yè)務(wù)，預(yù)示著MLLM的應(yīng)用范圍或?qū)⒊搅奶鞕C器人、郵件整理及圖像生成等傳統(tǒng)領(lǐng)域，向自動駕駛這一前沿陣地拓展。

傳統(tǒng)自動駕駛系統(tǒng)往往采用模塊化設(shè)計，針對感知、地圖構(gòu)建、預(yù)測及規(guī)劃等特定功能分別開發(fā)。盡管這種模式在過去取得了顯著成效，但Waymo指出，其存在可擴展性問題，模塊間的誤差累積和通信限制影響了整體性能，且面對新環(huán)境時適應(yīng)性不強。

Waymo認(rèn)為，像Gemini這樣的MLLM能夠有效解決上述問題。它們作為互聯(lián)網(wǎng)大數(shù)據(jù)培育的“通才”，擁有超越常規(guī)駕駛經(jīng)驗的廣泛“世界知識”，并通過“鏈?zhǔn)酵评怼钡认冗M技術(shù)展現(xiàn)出強大的邏輯推理能力，能夠模仿人類思維，將復(fù)雜任務(wù)分解為邏輯步驟。

據(jù)Waymo介紹，EMMA模型在應(yīng)對復(fù)雜交通環(huán)境時表現(xiàn)出色，如動物穿越道路或道路施工等情況，都能為無人駕駛汽車規(guī)劃出合理的行駛路徑。

值得注意的是，特斯拉等競爭對手也在積極開發(fā)自動駕駛汽車的端到端模型。特斯拉CEO埃隆·馬斯克曾宣稱，其最新版本的FSD 12.5.5采用了“端到端神經(jīng)網(wǎng)絡(luò)”AI系統(tǒng)，直接將攝像頭圖像轉(zhuǎn)化為駕駛決策。

盡管Waymo在部署無人駕駛車輛方面領(lǐng)先于特斯拉，但它同樣對端到端系統(tǒng)抱有濃厚興趣。Waymo表示，其EMMA模型在軌跡預(yù)測、物體識別和道路理解方面取得了優(yōu)異成績。

然而，EMMA也面臨挑戰(zhàn)。Waymo承認(rèn)，在將模型投入實際應(yīng)用前，還需克服一些障礙，如EMMA目前無法整合來自激光雷達或雷達的3D傳感器輸入，原因是“計算成本過高”，且僅能處理有限數(shù)量的圖像幀。

此外，研究論文中未提及的一個潛在風(fēng)險是，像Gemini這樣的MLLM可能會產(chǎn)生“幻覺”，這對于容錯率極低的無人駕駛汽車而言是極大的挑戰(zhàn)。因此，在MLLM能夠大規(guī)模應(yīng)用于自動駕駛之前，仍需開展更多深入研究。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6231

瀏覽量
108103
自動駕駛

自動駕駛

+關(guān)注

關(guān)注
788

文章
14312

瀏覽量
170564
waymo

waymo

+關(guān)注

關(guān)注
2

文章
314

瀏覽量
25157

要長高
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 量子芯片是什么東西量子芯片和普通芯片的區(qū)別
Hot openai是哪個公司的 OpenAI的代表產(chǎn)品有哪些

New AD203SN加固型軍用溫度范圍隔離放大器技術(shù)手冊
New MAX250/MAX251 5V、隔離型、RS-232驅(qū)動器/接收器技術(shù)手冊

精選推薦
更多

文章

資料

帖子

CMOS工藝中方塊電阻的主要類型和測試方法

芯長征科技
6小時前

267 閱讀

用于電動汽車供電網(wǎng)絡(luò)的高壓母線轉(zhuǎn)換器48V電源模塊

Vicor
7小時前

316 閱讀

Copilot操作指南（一）：使用圖片生成原理圖符號、PCB封裝

KiCad
9小時前

133 閱讀

如何構(gòu)建帶有VGA輸出的低分辨率熱成像

FPGA研究院
10小時前

356 閱讀

如何為EMC設(shè)計選擇PCB疊層結(jié)構(gòu)

Altium
10小時前

385 閱讀

充電器檢驗標(biāo)準(zhǔn)

laisvl
46

5積分

43下載

高級駕駛輔助系統(tǒng)ADAS核心設(shè)計攻略

盧國藝
4281KB

5積分

234下載

Falcon Web服務(wù)器文件安全監(jiān)控平臺

倪山騁
5.04 MB

2積分

1下載

Xmacs GNU TeXmacs發(fā)行版

ah此生不換
0.54 MB

免費

0下載

用于DSLR Trail Camera Trigger的光電探測器PCB

王霞
0.01 MB

2積分

1下載

匠芯創(chuàng)D133CBS RISC-V KunLun Pi V1.0開發(fā)板開發(fā)資料

ElecFans小喇叭
21小時前

93 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）代碼續(xù)寫

李洋水蛟龍
21小時前

95 閱讀

【沁恒CH585開發(fā)板免費試用體驗】手機控制小臺燈亮度與小風(fēng)扇轉(zhuǎn)速

yinwuqing
21小時前

99 閱讀

【嘉楠堪智K230開發(fā)板試用體驗】K230 AI 功能體驗

杯pp
21小時前

93 閱讀

【Milk-V Duo S 開發(fā)板免費體驗】ISP功能AE測試

jf_1137202360
21小時前

212 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)

評論