北大攜智元機器?團隊提出OmniManip架構

近日，北京大學與智元機器人的聯合實驗室有了重大成果，北?攜?智元機器?團隊提出 OmniManip 架構。

在具身智能領域，將視覺語言基礎模型（VLMs）應用于機器人實現通用操作一直是核心問題。目前存在兩大挑戰，一是VLMs缺乏精確3D理解能力，二是難以將高層次推理轉化為機器人低層次動作。

為解決這些難題，OmniManip架構應運而生。它基于以對象為中心的3D交互基元，把VLM的高層次推理能力轉化為機器人的低層次高精度動作。針對大模型幻覺和真實環境操作的不確定性，OmniManip引入了VLM規劃和機器人執行的雙閉環系統設計。

OmniManip的關鍵設計亮點頗多，包括基于VLM的任務解析，可將復雜任務分解為多個明確主動物體、被動物體和動作類型的結構化階段。還有閉環機器人執行，通過物體6D姿態跟蹤器實時更新物體位姿，轉換為機械臂操作軌跡。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器人

機器人

+關注

關注
213

文章
29556

瀏覽量
211906
語言模型

語言模型

+關注

關注
0

文章
561

瀏覽量
10704

麥辣雞腿堡
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 麒麟9000s相當于驍龍多少和驍龍多少處理器相當
Hot 華為麒麟9000s是多少納米的麒麟9000s什么檔次

New 15KV ESD保護 RS-232發射器/接收器ICL3237E數據手冊
New ICL3223 1A電源電流250kbps RS-232發射器/接收器數據手冊

精選推薦
更多

文章

資料

帖子

AI性能再進化！銘瑄推出搭載Intel Arrow Lake平臺一體化產品

大大通
16小時前

12 閱讀

利用EasyGo DeskSim創建實時仿真項目教程

EasyGo實時仿真
12分鐘前

18 閱讀

SiC MOSFET模塊的損耗計算

三菱電機半導體
15小時前

362 閱讀

適用TI ADS1299器件的ADS129x設備SPI通信問題調試步驟教程

向上
17小時前

252 閱讀

5G-A與AI共舞，廣東移動烹出高鐵網絡加速包

腦極體
22小時前

535 閱讀

Cuckoo開源惡意軟件分析沙盤

youyoulan
18.97 MB

免費

0下載

Allusion圖像庫管理工具

王莉
18.64 MB

2積分

7下載

KotlinMvp Kotlin編寫短視頻小應用

王霞
18.27 MB

2積分

1下載

Corda開源分布式賬本項目

雅博電子科技
0.00 MB

2積分

1下載

Sequel Ace Mac數據庫管理應用程序

李英
66.04 MB

免費

1下載

[經驗] RT-Thread 潘多拉 STM32L475

jf_42241628
9小時前

35 閱讀

ArkUI-X跨平臺技術落地-華為運動健康(二)

jf_14971143
1天前

29 閱讀

【正點原子STM32MP257開發板試用】數字識別

jf_07365693
1天前

16 閱讀

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

xinglong01
1天前

26 閱讀

【高云GW5AT-LV60 開發套件試用體驗】串口通信回環

qiushi07
1天前

32 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

北大攜智元機器?團隊提出OmniManip架構

評論