如今科技發展日新月異,諸如機器人、AR/VR等前沿科技產品已走入了大眾生活當中。但是想在這些領域讓用戶有更好的體驗,就需要很多底層技術的支持,SLAM就是其中之一。如果說機器人離開了SLAM,就相當于人類失去了雙眼一樣。
一、什么是視覺SLAM?
SLAM的英文全稱是Simultaneous Localization and Mapping,中文稱作「即時定位與地圖創建」,而視覺SLAM就是用攝像頭來完成環境的感知工作。
舉個例子,當你第一天去上大學的時候,為了迅速熟悉校園環境并且找到宿舍時,你會做以下的事情:
1.用眼睛一直觀察周圍的教學樓、籃球場、噴泉等標志性建筑物,并且記住它們的特征。(特征提取)
2.根據你剛才眼睛觀察到的信息,在腦海里把這些有特征的標志性建筑物建立成一個地圖。(建圖)
3.在繼續行走時,又看到了一些如咖啡店、健身房等新的標志性建筑物,再把它們加到腦海中的地圖里面校對一下。(狀態更新)
4.根據你前一段時間行走獲得的標志性建筑物,確定自己的位置。(路徑規劃)
5.當無意中走了很長一段路的時候,和腦海中的以往標志性建筑物進行匹配,看一看是否走回了原路。(回環檢測)
其實上面你做的這些事情,就是視覺SLAM里面的幾個部分。
二、視覺SLAM的分類
視覺SLAM研究主要分為三大類:單目、雙目(或多目)、RGBD。
單目僅用一支攝像頭就能完成SLAM。最大的優點是傳感器簡單且成本低廉,但同時也有個大問題,就是不能確切的得到深度,存在尺寸不確定的現象,比如丟失深度信息的相片中,我們能見到“手捏太陽”“借位拍照”這樣的現象。
一方面是由于絕對深度未知,單目SLAM不能得到機器人運動軌跡及地圖的真實大小,如果把軌跡和房間同時放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計一個相對深度。另一方面,單目相機無法依靠一張圖像獲得圖像中物體離自己的相對距離。為了估計這個相對深度,單目SLAM要靠運動中的三角測量,來求解相機運動并估計像素的空間位置。即是說,它的軌跡和地圖,只有在相機運動之后才能收斂,如果相機不進行運動時,就無法得知像素的位置。同時,相機運動還不能是純粹的旋轉,這就給單目SLAM的應用帶來了一些麻煩。
雙目(多目)顧名思義是由兩個或多個攝像頭來完成SLAM,其普遍為雙目視覺方案。雙目視覺既可以在運動時估計深度,亦可在靜止時估計,雙目視覺融合兩個攝像頭獲得的圖像并觀察它們之間的差別,獲得明顯的深度感,建立特征間的對應關系,將同一空間物理點在不同圖像中的映像點對應起來。并且可以精準感知周圍的物體和自身移動的軌跡,從而對周圍環境形成三維立體的認識,解決了上面提到的問題。不過通過雙目圖像計算像素距離,計算量大,而且在特征少的白墻或暗光環境易丟失目標。
目前雙目的應用程度明顯較高,針對雙目方案拓展應用場景上,大多融和了IMU或者IR等傳感器,比如國內立體視覺方案公司indemind推出的雙目視覺慣性模組,采用了“雙目攝像頭+IMU”多傳感器融合架構與微秒級時間同步機制,可提供精準穩定數據源;并且內置了自研高精度Vi-SLAM算法,以滿足SLAM研究、智能機器人、無人機避障、室內外導航定位等使用需求。
RGBD相機是2010年左右開始興起的一種相機,它最大的特點是可以通過紅外結構光或Time-of-Flight原理,直接測出圖像中各像素離相機的距離。因此,它比傳統相機能夠提供更豐富的信息,也不必像單目或雙目那樣費時費力地計算深度。
目前常用的RGBD相機有Kinect/Kinect V2等等。不過,現在多數RGBD相機還存在測量范圍窄、噪聲大、視野小、受陽光,墻面反光等諸多問題。出于量程的限制,主要用于室內SLAM。
目前,視覺SLAM主要被運用于無人機、無人駕駛、機器人、AR、智能家居等領域,單目需要靠運動估計深度導致避障效率不高,RGBD存在量程的限制,主要用于室內SLAM。因此,目前在視覺SLAM中,雙目的應用程度和落地前景都是最高的。
不管是哪種視覺SLAM方案,都是作為人工智能的眼睛,獲取地圖數據,并構建地圖,規避路程中遇到的障礙物,實現路徑的規劃。
隨著城市物聯網和智能系統的完善,視覺SLAM必是大勢所趨。雖然目前視覺SLAM技術方面還存在著一些問題,但這些都會隨著消費刺激和產業鏈的發展逐步解決、趨于完善。
lw
-
人工智能
+關注
關注
1805文章
48843瀏覽量
247373 -
SLAM
+關注
關注
24文章
437瀏覽量
32375 -
無人駕駛
+關注
關注
99文章
4162瀏覽量
123066
發布評論請先 登錄
基于高斯的稠密視覺SLAM研究

【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用
【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例
一種基于點、線和消失點特征的單目SLAM系統設計

一種基于MASt3R的實時稠密SLAM系統
用于任意排列多相機的通用視覺里程計系統

利用VLM和MLLMs實現SLAM語義增強


激光雷達在SLAM算法中的應用綜述

MG-SLAM:融合結構化線特征優化高斯SLAM算法

從算法角度看 SLAM(第 2 部分)

評論