導讀
一個雙目立體視覺的常用應用場景的介紹,很基礎。
立體視覺
立體視覺意味著人工智能可以通過一對相機來感知圖像的深度以及物體的距離。大多數三維相機模型都是基于立體視覺理論和技術的。兩臺攝像機之間設置一定的距離,這樣它們就可以從不同的角度“看”物體。評估兩個圖像之間的對應關系,人工智能確定到目標的距離,分析,并建立目標的3D結構。
采用立體視覺,不需要紅外傳感器、聲波定位儀、激光雷達等測距傳感器,可大大降低了技術解決方案的成本。
主要應用場景:
1、人體姿態和手勢識別。
2、3D模型和3D場景的構建。
3、自動駕駛系統的障礙定位和檢測。
每個特定的場景都可以改動以解決特定的問題。因此,3D場景重建可以用來測量物體或產品的體積。
在實踐中,立體視覺通過兩臺攝像機分四個階段實現:
1、畸變校正 — 一種去除圖像上透鏡的徑向和切向畸變的數學方法,以獲得未失真的圖像。
2、在校正過程中調整相機之間的角度和距離。結果是直線對齊和細化圖像,即同一平面的兩幅圖像共面,其直線對齊方向相同,具有相同的y坐標。
3、點匹配過程 — 搜索左、右攝像頭點之間的對應關系。在那之后,你會得到有一個視差圖 —— 其中的值對應于左右攝像機同一點的圖像x坐標的差異。
4、因此,有了相機的幾何排列,我們產生了視差圖的三角度量。這是重投影階段,形成深度圖,也就是想要的3D場景。
對于前兩個階段,你必須首先計算這一對相機的配置參數。這可以通過各種二值化的標定板自動完成,比如ArUco或ChArUco。這些標定板的主要優點是,即使是單個標定板也能提供足夠的一致性來獲得相機的姿勢。此外,內部的二進制編碼使它們特別可靠,因為它可以進行錯誤檢測和糾正。你也可以使用標定板來確定相機下區域的幾何形狀。
體積度量
為了度量體積,你還需要進行下面的步驟:
1、對一組連續的幀進行累積,這將增加錯誤恢復的彈性,用于對3D場景進行平均或細化。
2、只在場景中選擇產品定義的點。這是通過使用顏色分割、模板匹配或神經網絡語義分割來實現的。最快的方法是顏色分割。該方法的缺點是將設置綁定到特定的產品上,如果背景顏色和對象不是很清楚,可能會產生不好的結果。如果GPU優化是可能的,那么使用U形卷積神經網絡如U-net和高級U-net,或全卷積神經網絡會有較高的性能和分割精度。
3、對一個由產品定義的3D點組成的場景進行聚類。每個簇是一個對象。
4、為每個簇形成一個凸多邊形,消除3d場景對象的邊緣缺陷
5、使用線性插值恢復缺失的3D點
6、通過基于場景的幾何聚類區域積分來計算單個對象的體積。
7、最后,計算所有物體的總體積。
審核編輯 :李倩
-
立體視覺
+關注
關注
0文章
38瀏覽量
9944 -
計算機視覺
+關注
關注
9文章
1709瀏覽量
46784 -
自動駕駛
+關注
關注
790文章
14321瀏覽量
170703
原文標題:計算機視覺中的雙目立體視覺和體積度量
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
雙目視覺在智能駕駛領域的應用
智能軟件+硬件解決方案克服實時立體視覺中的挑戰

中科慧眼三目立體視覺相機將亮相2025上海車展
英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

Arm KleidiCV與OpenCV集成助力移動端計算機視覺性能優化
【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

立體視覺新手必看:英特爾? 實感? D421深度相機模組

計算機視覺有哪些優缺點
圖像處理器與計算機視覺有什么關系和區別
計算機視覺中的圖像融合

評論