在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

177倍加速!NVIDIA最新開源 | GPU加速各種SDF建圖!

3D視覺工坊 ? 來源:計算機視覺工坊 ? 2023-11-09 16:46 ? 次閱讀

0. 筆者個人體會

很多SLAM系統(tǒng)為了實時估計位姿,建立的是稀疏地圖,這種地圖很難用作導(dǎo)航和規(guī)劃任務(wù)。但是建立稠密地圖的話,又會降低運算效率。設(shè)計GPU加速稠密建圖是一個可行方案,但需要使用大量繁瑣的CUDA編程,這個工作量巨大!

但最近,NVIDIA和ETHZ就聯(lián)合提出了nvblox,是一個使用GPU加速SDF建圖的庫。計算速度非???,相較CPU計算TSDF甚至快了177倍。更重要的是,因為所有數(shù)據(jù)都已經(jīng)存儲在GPU上,所以很容易和深度學(xué)習(xí)方案結(jié)合!

對建圖速度有要求的小伙伴可以關(guān)注一下這項工作。

1. 效果展示

nvblox以2cm的分辨率很快建立了SDF地圖:

bd5763cc-7eb0-11ee-939d-92fbcf53809c.png

辦公室移動機器人實驗,包括一個重建mesh,一個距離場slice,一個占用概率表示的動態(tài)目標(biāo)(人)。其中場景的動態(tài)部分隨時間衰減,靜態(tài)部分使用TSDF融合實現(xiàn)精確重建。

bd686442-7eb0-11ee-939d-92fbcf53809c.png

這項工作最大的亮點在于,極大加快速度,又不損失精度。源代碼和相應(yīng)的ROS代碼都開源了,感興趣的小伙伴可以關(guān)注一下,下面來看具體的論文信息。

2. 摘要

稠密體素地圖對于機器人在雜亂空間中的安全導(dǎo)航以及與環(huán)境的交互至關(guān)重要。對于延遲和魯棒性,如果這些可以在計算受限的硬件上從相機或基于激光雷達的傳感器進行板載計算,則是最好的。以前的工作在基于CPU的機器人地圖繪制系統(tǒng)和基于GPU的重建系統(tǒng)之間留下了差距,前者由于計算約束限制了地圖分辨率或比例,后者忽略了對機器人路徑規(guī)劃至關(guān)重要的特征。我們引入了一個庫nvblox,旨在通過GPU加速機器人體素建圖來填補這一空白,并針對嵌入式GPU進行了優(yōu)化。nvblox提供了超越現(xiàn)有技術(shù)的顯著性能改進,在表面重建方面實現(xiàn)了高達177倍的加速,在距離場計算方面實現(xiàn)了高達31倍的改進,并且是開源的。

3. 算法解析

重述一下問題:

給定RGB-D或LiDAR輸入,位姿已知,建立體素地圖,將3D點映射為距離、占用、顏色等信息,輸出表面重建(占用/TSDF)或距離場(ESDF)。

傳統(tǒng)的建圖方法有什么問題?

使用CPU建圖太慢了!

這項工作是怎么做的?

nvblox希望使用GPU來加速建圖,具體架構(gòu)包括多層地圖(TSDF、顏色、占用、Mesh、ESDF,用戶自己定義)、幀積分器(添加傳感器數(shù)據(jù)到地圖)、格式轉(zhuǎn)換(轉(zhuǎn)換地圖格式),最終導(dǎo)出包含ESDF和網(wǎng)格重建的體素網(wǎng)格。使用時還可以增加地圖圖層,也可以擴展為語義標(biāo)簽等其他類型。

bd828c6e-7eb0-11ee-939d-92fbcf53809c.png

這個ESDF是啥?

ESDF地圖是歐幾里得符號距離場,場里面的每一個體素都包含了距離它最近的障礙物的歐幾里得距離。對于路徑規(guī)劃來說,ESDF比TSDF更合適一些。ETHZ之前的工作voxblox計算的是準(zhǔn)歐幾里得距離,這樣即使地圖變化很小,更新計算量也非常大。相比之下,nvblox直接利用GPU計算歐幾里得距離。

ESDF加速如何進行?

作者在PBA的基礎(chǔ)上二次開發(fā),來加速ESDF計算,算法總流程:

1、在分配塊中,輸入TSDF層和更新的體素塊列表;

2、標(biāo)記位置(在障礙計算中可以是父體的體素,也就是表面邊界上的體素)。也就是說,這個體素的子體素是其最近的表面邊界的體素。還需要處理兩種常見情況:新占用以及新空閑的體素。新占用的體素可以簡單地采用它們的TSDF值,并添加到索引中更新。新空閑的體素需要將它們的距離重置為最大值;

bd996e98-7eb0-11ee-939d-92fbcf53809c.png

3、清除無效值。具體做法是找到其父體不再是一個位置的體素,重新計算距離,選擇塊索引中最大ESDF距離內(nèi)的映射子集,然后檢查每個體素是否仍然具有有效的父體;

4、降低ESDF體素距離;

5、通過跨塊邊界通信來更新相鄰塊,從而協(xié)調(diào)體素塊之間的差異;

6、如果最后一級需要通過體素塊邊界進行通信,則進行另一次掃描。重復(fù)掃描領(lǐng)域更新循環(huán),直到所有塊都更新完成。

bda4b97e-7eb0-11ee-939d-92fbcf53809c.png

ESDF加速的可視化結(jié)果,該算法的總體思想是迭代計算體素塊內(nèi)的正確距離值,然后將體素塊邊界上的距離信息傳遞給領(lǐng)域,實現(xiàn)高度并行化。

bdb516de-7eb0-11ee-939d-92fbcf53809c.png

4. 實驗結(jié)果

整個實驗部分的核心觀點是:nvblox可以在提高建圖(ESDF)速度的同時,不損失建圖精度。實驗設(shè)備選擇了三個平臺:臺式機(Intel i9 CPU和NVIDIA RTX3090 Ti GPU),筆記本(Intel i7 CPU和RTX3000 Mobile GPU),還有Jetson Xavier AGX。使用的數(shù)據(jù)集是Replica和Redwood。

首先是各個部分和voxblox(ETHZ之前的工作,使用CPU建圖,參考Voxblox: Incremental 3D Euclidean Signed Distance Fields forOn-Board MAV Planning)的耗時對比,其中每4幀執(zhí)行了生成了一次ESDF和網(wǎng)格,分辨率是5cm??梢园l(fā)現(xiàn)每部分的加速都非常明顯,TSDF甚至加快了177倍!

bdc09bd0-7eb0-11ee-939d-92fbcf53809c.png

增量ESDF計算的定量對比,對比方案包括voxblox和Fiesta,運行設(shè)備是桌面GPU。表格數(shù)據(jù)是重建體素的中值誤差,結(jié)果顯示voxblox和Fiesta的速度分別提高了31倍和4倍,關(guān)鍵是沒有損失精度。

bdc8170c-7eb0-11ee-939d-92fbcf53809c.png

查詢時間的對比,在GPU上采集3D點,并在GPU上執(zhí)行ESDF查找,返回它們到最近表面的距離以及可選的距離場梯度。cor表示空間相關(guān),uncor表示不相關(guān)。這里也推薦「3D視覺工坊」新課程《徹底剖析激光-視覺-IMU-GPS融合SLAM算法:理論推導(dǎo)、代碼講解和實戰(zhàn)》。

bdd30086-7eb0-11ee-939d-92fbcf53809c.png

nvblox的應(yīng)用示例,重建了一個無人機采集的場景,還是體現(xiàn)實時性。

bddcd052-7eb0-11ee-939d-92fbcf53809c.png

5. 總結(jié)

今天筆者為大家介紹了一個GPU加速的體素建圖庫nvblox,主要工作量是提出了一種新穎的增量式GPU加速方法來計算ESDF。nvblox針對獨立和嵌入式GPU都進行了優(yōu)化,計算速度非??臁▓D速度有要求的小伙伴可以關(guān)注一下這項工作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    212

    文章

    29246

    瀏覽量

    210802
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4880

    瀏覽量

    130352
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5546

    瀏覽量

    122279

原文標(biāo)題:177倍加速!NVIDIA最新開源 | GPU加速各種SDF建圖!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GPU設(shè)計 打造最簡單與最快速的加速方案

    現(xiàn)在,全新NVIDIA Tesla K80雙GPU加速器已經(jīng)推出,它囊括了諸多設(shè)計創(chuàng)新,是Tesla加速計算平臺系列中的旗艦產(chǎn)品。性能方面,Tesla K80比當(dāng)今最快的CPU高10
    發(fā)表于 06-25 10:23 ?1379次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 - NVIDIA
    發(fā)表于 12-16 14:25

    GPU加速XenApp/Windows 2016/Office/IE性能會提高嗎

    Shark來查看哪些程序/進程使用GPU(硬件加速)。它看起來不像Internet Explorer 11或Office 2016根本不使用GPU。我已經(jīng)驗證IE和Office都啟用了硬件
    發(fā)表于 09-12 16:24

    GPU加速matlab程序

    最近遇到了一個加速matlab程序的問題,不知道如何利用GPU,以及使用GPU的先決條件,是不是GPU加速必須要用cuda,最重要的是只用G
    發(fā)表于 03-30 11:21

    tengine是如何使用arm的GPU進行加速

    【嵌入式AI】多目標(biāo)分類檢測系統(tǒng)實戰(zhàn)中,tengine是如何使用arm的GPU進行加速的,這個原理能詳細(xì)說明一下嗎?
    發(fā)表于 09-02 14:18

    NVIDIA宣布一套用于構(gòu)建GPU加速ARM服務(wù)器的參考設(shè)計

    在最新的超級計算大會上,NVIDIA創(chuàng)始人兼CEO黃仁勛宣布了一套用于構(gòu)建GPU加速ARM服務(wù)器的參考設(shè)計,從而大大擴展GPU加速對于超級計
    的頭像 發(fā)表于 11-20 15:30 ?2993次閱讀

    NVIDIA推出適用于Python的VPF,簡化開發(fā)GPU加速視頻編碼/解碼

    NVIDIA推出了適用于Python的開源視頻處理框架“VideoProcessingFramework”(VPF)。據(jù)悉,VPF 是一組開源的C ++庫和Python綁定,可與其封閉源代碼Codec SDK進行交互。該框架的功
    的頭像 發(fā)表于 12-18 14:25 ?7218次閱讀

    NVIDIA GPU助力加速先進對話式AI技術(shù)

    NVIDIA Riva 是一種 GPU 加速應(yīng)用程序框架,允許公司使用視頻和語音數(shù)據(jù),為自己的行業(yè)、產(chǎn)品和客戶定制最先進的對話式 AI 服務(wù)。
    的頭像 發(fā)表于 05-06 14:28 ?1840次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>助力<b class='flag-5'>加速</b>先進對話式AI技術(shù)

    使用GPU加速RELION進行生物結(jié)構(gòu)解析

    NVIDIA 與智東西公開課共同策劃推出「GPU 加速高性能計算(HPC)經(jīng)典應(yīng)用在線研討會」。研討會將聚焦經(jīng)典高性能計算和科學(xué)計算應(yīng)用,以及如何在 GPU 平臺更好的
    的頭像 發(fā)表于 06-22 10:06 ?1789次閱讀

    使用NVIDIA數(shù)學(xué)庫加速GPU應(yīng)用程序

      加速 GPU 應(yīng)用程序的主要方法有三種:編譯器指令、編程語言和預(yù)編程庫。編譯器指令,例如 OpenACC a 允許您順利地將代碼移植到 GPU 以使用基于指令的編程模型進行加速。雖
    的頭像 發(fā)表于 10-10 15:11 ?7791次閱讀
    使用<b class='flag-5'>NVIDIA</b>數(shù)學(xué)庫<b class='flag-5'>加速</b><b class='flag-5'>GPU</b>應(yīng)用程序

    【百萬倍加速加速計算重新定義藥物研發(fā)

    我們將通過《NVIDIA 加速計算,百萬倍加速行業(yè)應(yīng)用》系列文章,為您詳解 NVIDIA 如何通過數(shù)據(jù)中心規(guī)模的全棧加速計算,助力多個行業(yè)實
    的頭像 發(fā)表于 12-06 19:50 ?610次閱讀

    【百萬倍加速加速計算助力基因測序突破極限

    我們將通過《NVIDIA 加速計算,百萬倍加速行業(yè)應(yīng)用》系列文章,為您詳解 NVIDIA 如何通過數(shù)據(jù)中心規(guī)模的全棧加速計算,助力多個行業(yè)實
    的頭像 發(fā)表于 02-02 11:35 ?741次閱讀

    GTC23 | NVIDIA 發(fā)布用于加速量子-經(jīng)典混合計算的全新系統(tǒng)

    NVIDIA 和 Quantum Machines 發(fā)布首個結(jié)合 GPU 與量子計算的系統(tǒng)——DGX Quantum,采用全新開源 CUDA Quantum 軟件平 臺 加利福尼亞州圣克拉拉
    的頭像 發(fā)表于 03-23 06:55 ?711次閱讀

    Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計算實例

    。為了幫助滿足這一需求,Oracle 云基礎(chǔ)設(shè)施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU ,同時 NVIDIA L40S
    的頭像 發(fā)表于 09-25 20:40 ?709次閱讀
    Oracle 云基礎(chǔ)設(shè)施提供新的 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>計算實例

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個
    的頭像 發(fā)表于 04-28 10:36 ?812次閱讀
    主站蜘蛛池模板: 日操夜干 | 久久88色综合色鬼 | 久久国产乱子伦精品免费午夜 | 欧美性野久久久久久久久 | 丁香六月激情综合 | 国产小视频你懂的 | 亚洲色图21p| 成人欧美一区二区三区 | 亚洲qingse中文字幕久久 | 女性一级全黄生活片免费看 | 四虎色影院 | 超级乱淫伦网站 | 手机在线观看国产精选免费 | 狠狠色丁香久久婷婷综 | 欧美大黄| 亚洲在成人网在线看 | 免费看大美女大黄大色 | 男女性接交无遮挡免费看视频 | 狠狠狠操 | 永久免费观看黄网站 | 大黄网站在线观看 | 乱妇伦小说 | 亚洲国产婷婷综合在线精品 | 午夜视频在线免费看 | 亚洲天天 | 69日本人xxxxxxxx18 | 亚洲一区二区三区在线视频 | 国产在视频线精品视频2021 | 东京加勒比 | 好硬好湿好爽再深一点h | 色综合视频一区二区三区 | 日韩在线视频www色 日韩在线视频免费观看 | 午夜亚洲福利 | 黄色毛片播放 | 日本三级香港三级人妇 m | 天天操天天艹 | 欧美一级做一a做片性视频 欧美一级做一级做片性十三 | 黄色网网址 | 亚洲热热久久九九精品 | 午夜视频欧美 | 拍拍拍美女黄色1000视频 |