電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)在人形機器人的設(shè)計方案中,3D 視覺技術(shù)是實現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機器人完成環(huán)境感知與建模、動態(tài)目標(biāo)檢測與跟蹤、物體操作與精細控制等任務(wù),顯著提升人形機器人的安全性與魯棒性。
相較于其他類型的傳感器,3D 視覺傳感器具有精度高、信息量大、集成度高等諸多優(yōu)勢。浙商證券的研究指出,機器人視覺承擔(dān)了 80% 的信息獲取任務(wù)。相關(guān)預(yù)測數(shù)據(jù)顯示,人形機器人 3D 視覺傳感器的市場規(guī)模將從 2025 年的 1.4 億元大幅增長至 2030 年的 91.5 億元,復(fù)合年增長率(CAGR)高達 132%。
3D 視覺技術(shù)發(fā)展路線?
當(dāng)前,人形機器人的 3D 視覺技術(shù)路線主要圍繞 “如何獲取 3D 信息” 和 “如何處理 3D 數(shù)據(jù)” 展開,主要包含以下幾類:?
首先是多目立體視覺。其原理是通過多個相機模擬人眼視差,進而計算像素級深度圖。該技術(shù)具有成本低、結(jié)構(gòu)簡單、適合中距離場景的優(yōu)勢。然而,多目立體視覺的計算復(fù)雜度較高,需要對左右圖像特征進行匹配,并且在弱紋理或低光照環(huán)境下,精度會有所下降。目前,有相當(dāng)一部分人形機器人采用多目 3D 視覺傳感器,例如優(yōu)必選的 Walker X、普渡科技的 PUDU D9 等。
其次是激光雷達,也被稱為激光雷達的可視化技術(shù),它利用激光雷達進行高精度三維重建。基于激光雷達和視覺的 SLAM 技術(shù)分別被稱為激光 SLAM 和視覺 VSLAM。激光 SLAM 又因傳感器應(yīng)用不同,分為單線(2D)和多線(3D)激光雷達兩種。3D SLAM 使用多線激光雷達獲取環(huán)境三維數(shù)據(jù),并通過三維數(shù)據(jù)的特征點匹配進行定位。三維動態(tài)成像能夠精確知曉物體的形狀和大小,對環(huán)境信息的還原度極高。不過,3D 激光雷達的成本普遍較高,多用于工業(yè)或高端場景。
第三種是結(jié)構(gòu)光(Structured Light)。其原理是將已知圖案(如條紋、格雷碼)投射到物體表面,通過畸變圖案恢復(fù) 3D 形狀。結(jié)構(gòu)光具有高精度(亞毫米級)、高分辨率的優(yōu)勢,適合近距離(0.1 - 2 米)物體重建,在近距離精度方面表現(xiàn)出色,適用于物體識別與交互場景。但它受環(huán)境光干擾較大,在戶外場景中的效果欠佳,且硬件體積相對較大。
第四種是飛行時間法(ToF),通過測量光脈沖往返時間來計算距離,分為間接(iToF)和直接(dToF)兩種,小米、波士頓動力等采用了此技術(shù)。ToF 具有實時性強(幀率可達 100Hz 以上)、抗干擾能力強(主動發(fā)光)的特點,適合動態(tài)場景。然而,ToF 的精度會隨著距離的增大而降低,并且容易受到多路徑反射的影響。目前,許多人形機器人在實時避障、手勢識別等方面采用 ToF 方案。
第五類是單目視覺與深度學(xué)習(xí)結(jié)合。通過單目相機采集 2D 圖像,利用深度學(xué)習(xí)模型(如 DepthNet、MonoDepth)估計深度。這種方式的優(yōu)點是成本極低(僅需單相機),并且可以通過大數(shù)據(jù)訓(xùn)練適應(yīng)復(fù)雜場景。但它的缺點也十分明顯,深度估計依賴先驗知識,在遮擋區(qū)域或無紋理區(qū)域容易出錯,需要進行后處理優(yōu)化,比較適合教育類場景中對輕量化有需求的人形機器人。
當(dāng)然,在目前的人形機器人中,3D 視覺基本不是依靠某一種技術(shù)來實現(xiàn)的,多傳感器融合是最為常見的方式。結(jié)合多種技術(shù),如雙目 RGB + 結(jié)構(gòu)光、ToF + 多目視覺、激光雷達 + 單目、激光雷達 + 多目等,以平衡精度與成本,同時提升在復(fù)雜場景中的魯棒性。
國內(nèi) 3D 視覺方案代表性廠商?
當(dāng)前,3D 視覺正步入高速發(fā)展階段,在消費電子、生物識別、機器人和汽車等眾多領(lǐng)域得到廣泛應(yīng)用。人形機器人則是另一個極具潛力的應(yīng)用場景。根據(jù)《人形機器人產(chǎn)業(yè)研究報告》,預(yù)計 2025 年中國人形機器人市場規(guī)模約為 53 億元,同比 2024 年實現(xiàn)翻倍增長;到 2029 年,中國人形機器人市場規(guī)模或?qū)⑦_到 750 億元,占世界總量的 32.7%,比例位居世界第一;到 2035 年,有望達到 3000 億元規(guī)模。
目前,國內(nèi)已經(jīng)形成了較為完備的 3D 視覺傳感器產(chǎn)業(yè)鏈。上游主要提供各類 3D 視覺傳感器的硬件,包括感光芯片等核心元器件,具有較強的定制化、專用化需求;中游是 3D 視覺感知方案商,基于深度引擎算法,結(jié)合具體應(yīng)用進行 3D 視覺傳感器的方案設(shè)計;下游是各類終端開發(fā)者,根據(jù)中游提供的方案,開發(fā)出相應(yīng)的應(yīng)用算法方案。同時,國內(nèi)也涌現(xiàn)出一批具有代表性的 3D 視覺方案公司,如奧比中光、天準(zhǔn)科技等。
奧比中光作為全球領(lǐng)先的 3D 視覺感知技術(shù)企業(yè),構(gòu)建了覆蓋結(jié)構(gòu)光、雙目、iToF、dToF、激光雷達(LiDAR)、工業(yè)三維測量六大技術(shù)路線的全棧式解決方案。其產(chǎn)品廣泛應(yīng)用于服務(wù)機器人、工業(yè)檢測、3D 掃描、刷臉支付等領(lǐng)域,服務(wù)全球超 1000 家客戶,在中國服務(wù)機器人 3D 視覺傳感器市場占有率超過 70%。該公司也被譽為國內(nèi) “3D 視覺第一股”,在全球率先完成具身智能機器人視覺的核心技術(shù)布局。
華捷艾米作為國內(nèi) 3D 視覺感知領(lǐng)域的先行者,其技術(shù)路線和產(chǎn)品方案深度融合了結(jié)構(gòu)光、自研芯片與 AI 算法,形成了覆蓋消費電子、智能家居、教育交互等場景的完整生態(tài)。華捷艾米的核心技術(shù)圍繞單目結(jié)構(gòu)光展開,通過自主研發(fā)的激光發(fā)射芯片、衍射光學(xué)元件(DOE)及深度算法,實現(xiàn)高精度 3D 感知。
天準(zhǔn)科技是國內(nèi)工業(yè)視覺裝備領(lǐng)域的領(lǐng)軍企業(yè),其 3D 視覺傳感方案以高精度、高可靠性為核心優(yōu)勢,深度融合光學(xué)設(shè)計、AI 算法與精密制造技術(shù),形成了覆蓋半導(dǎo)體檢測、工業(yè)自動化、消費電子、新能源等領(lǐng)域的完整解決方案。
此外,國內(nèi)較為知名的 3D 視覺方案公司還有華睿科技、光鑒科技、深視智能、安思疆科技、馭光科技、靈明光子、禾賽科技、知微傳感和速騰聚創(chuàng)等。
結(jié)語?
綜上所述,人形機器人的 3D 視覺技術(shù)路線各有優(yōu)劣。多目立體視覺、激光雷達、結(jié)構(gòu)光、飛行時間法(ToF)以及單目視覺與深度學(xué)習(xí)結(jié)合等技術(shù),在精度、成本、場景適應(yīng)性等方面各有特點,而多傳感器融合正逐漸成為平衡性能與需求的主流選擇。隨著人形機器人市場規(guī)模從 2025 年的 53 億元向 2035 年 3000 億元的宏偉目標(biāo)邁進,3D 視覺作為核心感知技術(shù),不僅要在技術(shù)創(chuàng)新上突破精度、實時性與環(huán)境魯棒性的瓶頸,更需在成本優(yōu)化方面加速推進,以滿足消費級場景的規(guī)模化需求。?
-
人形機器人
+關(guān)注
關(guān)注
4文章
611瀏覽量
17186
發(fā)布評論請先 登錄
相關(guān)推薦
AI驅(qū)動的人形機器人,成為激光雷達產(chǎn)業(yè)的下一個爆發(fā)點

昨日,杭州3D視覺傳感器公司獲數(shù)億元融資!

速騰聚創(chuàng)第100萬臺激光雷達下線,用于人形機器人?
機器人3D視覺傳感器需求爆發(fā)!英特爾、奧比中光領(lǐng)跑,百億市場爭奪戰(zhàn)開啟
禾賽科技CES 2025發(fā)布迷你型超半球3D激光雷達JT系列
禾賽科技推出面向機器人領(lǐng)域的迷你3D激光雷達
禾賽在CES 2025發(fā)布迷你3D激光雷達JT系列
解決方案 3D 視覺機器人賦能汽車制造新征程

禾賽將推出機器人領(lǐng)域迷你3D激光雷達

Sonair推出用于機器人避障的3D超聲波傳感器


3D雷達掃描機器人,抗粉塵、實時監(jiān)控 #3D雷達掃描機器人 #3D雷達料位計 #3D雷達物位計 #智慧料倉

復(fù)合機器人搭載2D視覺和3D視覺分別有什么不同 #2D視覺 #3D視覺 #視覺定位 #視覺引導(dǎo) #復(fù)合機器人
重磅| 奧比中光全新雙目系列3D相機,搭載自研芯片,為智能機器人而生

奧比中光正式發(fā)布全新Gemini 330系列雙目3D相機

評論